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Avant-propos 


Ce volume de la série TD, de la collection « Éco Sup », s'adresse aux étudiants de 
Licence d’Économie et de Gestion. Au début de chaque chapitre, les principales 
notions de cours et les résultats essentiels sont rappelés de façon succincte dans 
« L'essentiel du cours ». Un bref texte introductif indique les points essentiels qui 
vont être abordés et étudiés dans le chapitre. Il ne s’agit pas d’un résumé de cours, 
mais seulement d’un avant-propos où on essaie d'expliquer, dans un langage peu 
formalisé, le fondement et l'utilité des notions définies ensuite de façon plus for- 
melle. 


Chacun des huit chapitres présente la même structure. Un certain nombre d’affir- 
mations constituent le paragraphe « Pouvez-vous répondre ? ». La réponse en 
vrai-faux permet à l'étudiant de vérifier s’il a bien compris les principaux points 
de cours. Il doit exercer sa vigilance face à des affirmations, parfois simples, mais 
qui peuvent contenir un piège. 


Les « Questions de réflexion » qui sont proposées ensuite ont essentiellement 
pour but de mettre l’accent sur certains éléments de cours un peu délicats. Il faut 
être attentif aux commentaires qui figurent dans la solution de l'exercice, en fin de 
chapitre. 


Les exercices d’« Entraînement » permettent enfin à l'étudiant de tester sa capa- 
cité à passer de la théorie à la pratique. Ils suivent l’ordre de progression du cours 
et sont précédés d’un titre indiquant la principale notion à laquelle ils se rappor- 
tent. Une rubrique « Analyse de l'énoncé et conseils » précise la démarche à suivre 
et les résultats de cours à utiliser pour résoudre l'exercice proposé. 


Les solutions très détaillées sont regroupées en fin de chapitre, très souvent assor- 
ties de commentaires. 


Dans le dernier chapitre, les textes récents des examens de 2€ année de Licence 
d'Économie et Gestion de l’université Panthéon-Assas permettent de retrouver 
les principaux points abordés dans les chapitres précédents. L'étudiant peut ainsi 
évaluer le niveau de difficulté de ce qui peut être demandé à une épreuve d’exa- 
men. Les corrigés sont rassemblés après les énoncés. 


Je remercie Antoine Auberger pour ses judicieuses remarques et sa contribution à 
cette quatrième édition. 
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5 Notion 


de probabilité 


(1 L'ESSENTIEL DU COURS 


Si on veut formaliser un problème dans lequel le hasard intervient, on doit construire un 
modèle probabiliste, choisi en fonction du but que l'on poursuit. Ce modèle est constitué d'un 
ensemble fondamental, d'une tribu d'événements et d'une probabilité. Le choix de l'ensemble 
fondamental est très important pour le calcul ultérieur des probabilités des événements. 
Nous introduirons aussi les notions de probabilité conditionnelle et d'indépendance. La 
formule de Bayes est souvent très utile pour le calcul de probabilités conditionnelles. 


1. Ensemble fondamental 


Le résultat d’une expérience aléatoire s'appelle un événement élémentaire. L'en- 
semble des résultats possibles s'appelle ensemble fondamental (ou univers) et est 
noté traditionnellement Q. Chaque élément w de Q représente donc un événement 
élémentaire, et toute partie À C Q (ou À € P(Q)) sera un événement. Parfois on dit 
que @ est l’ensemble des éventualités possibles et les événements élémentaires sont 
alors les singletons, c'est-à-dire les ensembles réduits à un seul élément {w}, qui 
sont effectivement en toute rigueur des événements, puisqu'appartenant à P(Q), 
ce qui n’est pas le cas du point «w. 


2. Algèbre et tribu d'événements 


Le couple (Q, (&)) s'appelle un espace probabilisable. Même si & est fini, le cardinal 
de P(@) peut être un nombre très grand et dans ce cas on est amené alors à 
ne considérer qu’une famille restreinte À de parties de Q, 4 CP(Q). Pour que 
le résultat des opérations ensemblistes (union, intersection, complémentaire) soit 
encore un événement, il est nécessaire que la famille d'événements qui a été retenue 
soit fermée, ou stable, vis-à-vis de ces opérations, c’est-à-dire qu'il soit bien un 
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élément de la famille. De plus, les événements « certain », Q, et « impossible », Y, 
doivent également appartenir à cet ensemble. Ainsi, on associera à une épreuve 
aléatoire un ensemble non vide de parties de {, noté 4, qui vérifiera : 


[CG [pour tout À € À, alors À € 4; 
[C2 [pour tout À € 4 et tout B € A, alors AUB € 4. 


Il y a fermeture pour le complémentaire et l'union. Cet ensemble .4 s'appelle une 
algèbre de parties de (2. Bien entendu, grâce aux lois de Morgan, on a une définition 
équivalente en remplaçant la condition C2 par : 


LC; [pour tout À € 4 et tout B € A, alors ANB € À. 


> Propriétés d'une algèbre 


La famille étant non vide, on en conclut que : 


ÊWEeA et NEA 


Si A; e À pour 1 < j < n, on démontre par récurrence que : 
nl 
UJA; E À 
j=1 


Si À; € A pour 1 < j < n, on démontre également par passage au complé- 
mentaire que : 


NA E À 
j=1 


Cependant, certaines expériences peuvent se dérouler indéfiniment et on a donc 
besoin de renforcer la propriété P; de fermeture pour l'union finie par une condition 
de fermeture pour l’union dénombrable, soit : 


Si À, € À pour tout n € N, alors : 


00 
[JA e A 
n=0 


Cette condition exprime que toute union dénombrable d'événements est encore 
un événement. L'ensemble 4 auquel on impose les conditions C1 et C3 s'appelle 
alors une o-algèbre ou tribu d'événements. 


Le couple formé de l’ensemble fondamental & et de la tribu d'événements associée 
A s'appelle un espace probabilisable. 
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3. Probabilité 


Définition. On appelle probabilité P sur (Q, 4) une application P : 4 — [0,1] telle 
que : 


(i) P(Q) = 1; 


(ii) pour toute suite À, d'événements incompatibles, soit À, € 4 avec A, NA; = ÿ 
pourmÆ£n: 


P | Ja. — ÿ_P(A) 
n=0 n=0 
propriété dite de o-additivité. 


Une probabilité est donc une application qui à un événement va associer un nombre 
compris entre 0 et 1. Le triplet (Q, 4, P) s'appelle un espace probabilisé. 


b Propriétés 


L'événement impossible est de probabilité nulle : 

P() = 0 
La probabilité de l'événement complémentaire d’un événement quelconque 
A s'obtient par : 


P(À) = 1 — P(A) 


Si un événement en implique un autre, sa probabilité est plus petite : 
ACB= P(A) < P(B) 

La probabilité de l'union de deux événements s'obtient par la formule de 

Poincaré : 


P(AU B) = P(A) + P(B) — P(ANB) 


4. Probabilités conditionnelles 


On considère l’espace probabilisé (@,.4,P) et un événement particulier B de A 
tel que P(B) > 0. La connaissance de la réalisation de B modifie la probabilité de 
réalisation d’un événement élémentaire, puisque l’ensemble des résultats possibles 
est devenu B et non plus 2. Cette nouvelle probabilité, notée P(.|B), est définie sur 
la tribu conditionnelle : 


AIB = {ANB/A € A} 
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par : 


P(ANB 
pa = 220 


La formule de définition de la probabilité conditionnelle peut aussi s’écrire, si 
P(A) > 0: 


P(A NB) = P(B)P(AIB) = P(A)P(B|A) 


Elle s'appelle parfois formule des probabilités composées et se généralise par récur- 
rence : 


P(A NAN... N Au) = P(A1)P(AolA1)P(A3l A1 N A) … 
PAR AN. A 1) 


n k—1 
=P(A)][P au a 
k=2 i=1 


5. Théorème de Bayes 


Un système complet d'événements est une partition de {2 en événements {A1,...,A;} 
de probabilités strictement positives, P(A;) > 0 pour 1 < i < n, et incompatibles 
deux à deux, te. avec A; N A; = ÿ pour i £ j et > ;_, P(Ai) = 1. On suppose que 
les probabilités des événements inclus dans chacun des À; sont connues et on va 
donc décomposer un événement quelconque B sur ce système : 


s-5ne-8n[Ua)-Uune 


i=1 i=1 


On aboutit ainsi à la formule de la probabilité totale : 


P(B)= > [P(AiNB) = ÿ P(ADP(BIA) 


i=1 i=1 


Ceci va nous permettre de calculer les probabilités a posteriori P(A;|B), après réali- 
sation d'un événement B, à partir des probabilités a priori P(A;),1 <i<n: 


P(AiNB)  P(A)P(BIA;) 


P(B) on 
D_P(ADP(BIA) 


i=1 


P(A;lB) = 


résultat appelé formule de Bayes ou parfois théorème de Bayes. 
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6. Indépendance en probabilité 
Définition. Deux événements A et B sont dits indépendants, relativement à la probabilité 
P si: 
P(A NB) = P(A)P(B) 
La probabilité de réalisation simultanée de deux événements indépendants est 


égale au produit des probabilités que chacun de ces événements se produise 
séparément. En conséquence, si P(B) > 0: 


P(ANB) _ P(A)P(B) 
P(B)  P(B) 


La réalisation d’un événement ne modifie pas la probabilité de réalisation de 
l'autre. 


P(AIB) = = P(A) 


> Indépendance mutuelle 


Si l'on considère n événements A;, avec n > 2, il y a lieu de distinguer l’indépen- 
dance deux à deux qui impose : 


P(A; NA;) = P(A;)P(A;) 1<i £] <n 
de l'indépendance mutuelle, condition plus forte qui s'écrit : 
P(A;, N À;, lus s NA;,) LL P(A;,)P(A;,) _—. P(A;,) 2<k<n 


pour tous les sous-ensembles {ñ,...,ù} de {1,2,...,n}. 


() POUVEZ-VOUS RÉPONDRE ? 
SE 


Vrai Faux 
1. On peut associer deux ensembles fondamentaux différents à 
une même expérience. Cl CO] 
2. L'égalité P(A U B) = P(A) + P (B) implique que les événements 
A et B sont incompatibles. CO CO 


3. L'information apportée par la connaissance de la réalisation 

d'un événement B augmente la probabilité d’un autre événement 

À, ie. P(AIB) > P(A). EMA 
4. Si deux événements sont incompatibles, alors ils sont indépen- 

danits. 


D. Si deux événements sont indépendants, alors leurs complé- 
mentaires le sont aussi. OO 


6. Soit R = {a,b,c,d} avec équiprobabilité des événements élé- 
mentaires sur P(Q). Les événements À = {a,b} et B = {a,c} sont 
dépendants car ils sont réalisés simultanément quand l'événement 
élémentaire a est réalisé. CO CO 
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(# 
le QUESTIONS DE RÉFLEXION 


7. On lance deux pièces de monnaie parfaitement identiques et on note les trois 
résultats possibles PP, FF et PF où la lettre P (resp. F) désigne le résultat pile (resp. 
face). L'événement élémentaire PF est-il de probabilité 1/3? 


8. Un roi sanguinaire a imaginé le jeu suivant : il fait arrêter quelques-uns de ses 
sujets et les fait conduire devant un sac contenant mille jetons numérotés de un 
à mille; ils doivent alors tirer trois fois un jeton dont on note le numéro avant de 
le remettre dans le sac. Le roi leur demande alors de choisir Le cas dans lequel ils 
seront pendus : soit lorsque le produit des trois nombres est pair, soit dans le cas 
contraire. Quelle est la probabilité pour un sujet d’être pendu : 


— s’il connaît le calcul des probabilités ? 
— s'ilne le connaît pas? 


9. On considère deux événements quelconques A et B. Exprimer en fonction de 
P(A), P(B) et P(A NB) les probabilités conditionnelles suivantes : P(AÏA U B), 
P(AJA NB) et P(B|À) ; que devient cette dernière probabilité lorsque À et B sont 
indépendants ? 


10. On suppose que dans une famille de deux enfants, les différentes répartitions 
ordonnées fille-garçon sont équiprobables. 


a) Sachant que l’un au moins des enfants est une fille, calculer la probabilité que 
les deux enfants soient des filles. 


b) Si vous sonnez à l'appartement de cette famille et qu’une fille vous ouvre, 
quelle est la probabilité que l’autre enfant soit une fille? 


G ENTRAÎNEMENT 


Ensemble fondamental 


11. On lance simultanément deux dés numérotés de 1 à 6. Déterminer l’ensemble 
fondamental & dans les cas suivants : 


a) Les deux dés sont distincts (par exemple un rouge et un bleu). 
b) Les deux dés sont identiques. 


c) Les deux dés sont identiques et on s'intéresse seulement à la parité du résultat. 


Analyse de l'énoncé et conseils. L'ensemble fondamental est déterminé à chaque fois 
par la manière dont un résultat élémentaire va être noté. 
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12. On lance six boules dans quatre cases distinctes. Représenter l’ensemble 
fondamental € dans les deux cas suivants. 


a) Les boules sont numérotées de 1 à 6. 


b) Les boules sont identiques. 


Analyse de l'énoncé et conseils. Comme dans l'exercice précédent, il faut se poser la 
question de savoir ce qui caractérise un événement élémentaire. 


13. Au résultat pile du lancer d’une pièce on associe la valeur +1 et la valeur —1 
à face. Déterminer l’ensemble fondamental Q associé aux expériences aléatoires 
suivantes : 


a) On effectue six lancers successifs. 
b) On lance six pièces identiques simultanément. 


c) On lance six pièces identiques simultanément et on ne s'intéresse qu’à la valeur 
du résultat total obtenu. 


Analyse de l'énoncé et conseils. Chaque événement élémentaire est spécifié de façon 
différente selon les cas. 


Atomes 


14. Soit A, Bet Ctrois événements quelconques liés à une même épreuve aléatoire. 
Décomposer les événements E = (A U B)AC et F = AU (BAC) en une réunion 
d'événements incompatibles deux à deux et indécomposables, appelés atomes. 
Dans quel cas les événements E et F sont-ils confondus? 


Analyse de l'énoncé et conseils. Si un schéma ne peut en aucun cas remplacer une 
démonstration, la représentation des événements E et F à partir de À,B et C sera une 
aide précieuse pour déterminer leur décomposition en atomes. Ces derniers sont des 
événements qui s'expriment sous la forme ANBNC,ANBNC... 


Algèbre d'événements 


15. Soit = {a,b,c,d}. Déterminer l'algèbre 4 contenant les événements {c} et {d}. 


Analyse de l'énoncé et conseils. Ce sont les propriétés générales d’une algèbre qui 
vont permettre de déterminer celle qui est demandée. 


16. Soit R — {a,b,c,d,e}. Déterminer l'algèbre A engendrée par la partition 
I = {{a},{b, c}, {d} ,{e}} de ©. 


Analyse de l'énoncé et conseils. L’algèbre demandée doit contenir tous les éléments 
de la partition et donc aussi toutes leurs réunions. 
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17. Déterminer toutes les algèbres d'événements définies sur les ensembles @ 
suivants. 


a) A = {a}. 
b) Q = {a,b}. 
©) 8 = {a,b,c}. 


Analyse de l'énoncé et conseils. Les algèbres finies comportent 2K éléments, avec k 
variant de 1 à card Q. 


18. À l’aide des opérations d’union, d’intersection et de passage au complémen- 
taire, construire à partir de deux sous-ensembles quelconques À et B de @ toutes les 
parties possibles de cet ensemble fondamental. Montrer qu'il s’agit d’une algèbre 
d'événements. 


Analyse de l'énoncé et conseils. Il faut considérer la partition de @ que l’on peut 
former à partir des atomes (cf. exercice 14, page précédente). 


Tribu d'événements 


19. Soit Q un ensemble infini non dénombrable et € l’ensemble des parties À de 
2 telles que À ou bien À est dénombrable. Montrer que € est une o-algèbre ou 
tribu d'événements. 


Analyse de l'énoncé et conseils. Il faut vérifier les propriétés caractéristiques d’une 
tribu et utiliser le fait qu’un ensemble inclus dans un ensemble dénombrable est lui- 
même dénombrable. 


Calcul de probabilités 


t 


1 2 
20. Soit À et B deux événements tels que P(A) = 276) = 3 et P(AN B) — 


Calculer les probabilités de E = « au moins l’un de ces événements se produit » 
F = « un seul de ces événements se produit ». 


œ I 


Analyse de l'énoncé et conseils. C’est une application directe de la formule de 
Poincaré. 


21. On considère un lot de 100 bulletins sur lesquels figurent les réponses oui 
ou non à trois questions. Après dépouillement, les nombres de réponses oui aux 
questions 1, 2 et 3 sont respectivement 60, 40 et 30. Les nombres de réponses oui 
associées aux questions 1 et 2, 1 et3 et 2 et 3 sont respectivement 24, 15 et 12. Enfin, 
sur 10 bulletins il est répondu oui aux trois questions. On désigne par E;, 1 < i <3, 


© Dunod. La photocopie non autorisée est un délit. 


TD 1 « Notion de probabilité 9 


l'événement « la réponse est oui à la —-ème question » sur un bulletin prélevé au 
hasard parmi les 100. On demande d'exprimer à l’aide des EF; les trois événements 
suivants, puis de calculer leur probabilité : sur le bulletin prélevé, on a obtenu deux 
oui et un non, un oui et deux non, trois non. 


Analyse de l'énoncé et conseils. Il faut décomposer chaque événement considéré en 
événements incompatibles et utiliser une formule souvent utile dans ce type d'exercice : 
P(ANB) = P(A) — P(ANB). 


22. Un étudiant doit répondre à quatre questions à choix multiple où trois 
réponses sont proposées à chaque fois, une seule étant correcte. 


a) Dans le cas où l'étudiant répond au hasard et de façon indépendante à chaque 
question, calculer la probabilité qu'il donne plus de réponses justes que fausses. 


b) Que devient cette probabilité s’il n’y a que deux réponses possibles à chaque 
question? et s’il y en a quatre? 


Analyse de l'énoncé et conseils. On construit l’ensemble fondamental le plus simple 
décrivant l’ensemble des résultats possibles, de telle sorte qu'il y ait équiprobabilité des 
événements élémentaires. Ayant écrit l'événement considéré à l’aide de ces événements 
élémentaires, le calcul de sa probabilité se fait sans difficulté. 


23. Deux joueurs À et B participent à un jeu avec des probabilités respectives de 
victoire à chaque partie p et q = 1 — p. Le gagnant est celui qui le premier obtient 
deux victoires de plus que l’autre. Quelle est la probabilité de gain de chaque 
joueur ? 


Analyse de l'énoncé et conseils. Il est conseillé de faire un arbre du déroulement 
des deux premières parties et de marquer à l'extrémité des quatre branches la nouvelle 
valeur de la probabilité de gain du joueur À par exemple. 


Problèmes de dénombrement 

24. On jette trois dés identiques numérotés de 1 à 6. Calculer la probabilité 
d'observer les résultats suivants. 

a) Trois fois le même chiffre. 

b) Deux fois le même chiffre et un autre différent. 


©) Trois chiffres différents. 


Analyse de l'énoncé et conseils. Ayant construit l'ensemble fondamental où il y 
a équiprobabilité des événements élémentaires, on écrit, en utilisant par exemple les 
lettres de l'alphabet, la forme générale du résultat considéré pour calculer ensuite le 
nombre de résultats différents de cette forme. 
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25. On tire au hasard et sans remise cinq cartes d’un jeu de trente deux. Calculer 
la probabilité d'obtenir : une paire (résultat de la forme aabcd), deux paires (aabbc), 
un full (aaabb). 


Analyse de l'énoncé et conseils. Voir exercice précédent. Il s’agit de problèmes 
combinatoires délicats qui demandent beaucoup d'attention pour bien déterminer tous 
les résultats différents ayant la même forme. 


26. Un tiroir contient n paires de gants différentes. En raison d’une panne d’élec- 
tricité, Achille Talon prend au hasard 2r gants dans ce tiroir, avec r < n. Quelle est 
la probabilité qu'il n’ait obtenu aucune paire de gants appareillés ? 


Analyse de l'énoncé et conseils. Il faut d’abord dénombrer tous les résultats possibles 
équiprobables. Ensuite, on doit examiner comment les gants doivent être choisis pour 
qu'il n’y ait aucune paire appareillée, en n’oubliant pas qu'une paire est constituée de 
deux gants, un droit et un gauche! 


Probabilités conditionnelles 


27. On cherche une lettre qui a la probabilité p de se trouver dans l’un des quatre 
tiroirs d’un secrétaire. Quelle est la probabilité qu’elle se trouve dans le quatrième 
tiroir, sachant qu’on ne l’a pas trouvée dans les trois premiers? 


Analyse de l'énoncé et conseils. C'est une simple application de la définition d’une 
probabilité conditionnelle. Il faut cependant bien noter que p est la probabilité que la 
lettre soit dans le secrétaire et que, si elle y est, tous les tiroirs ont la même probabilité 
de la contenir. 


28. On considère trois urnes U:, U et U; qui contiennent respectivement deux 
boules noires, deux boules blanches et une blanche et une noire. On vous présente 
l’une de ces trois urnes tirée au hasard ; quelle est la probabilité que ce soit U : 


— si vous savez que l’urne contient au moins une boule noire? 


— si vous tirez une boule noire? 


Analyse de l'énoncé et conseils. Il s’agit encore du calcul d’une probabilité condi- 
tionnelle où il faut seulement être attentif à la définition de l'événement par lequel on 
conditionne. 


29. Une élection a lieu au scrutin majoritaire à deux tours. Deux candidats À 
et B sont en présence. Au premier tour 40% des voix vont à À et 45% à B, le 
reste étant constitué d’abstentions. Aucun candidat n'ayant la majorité absolue, 
un second tour est organisé. Tous les électeurs ayant voté la première fois voteront 
à nouveau. Un sondage indique par ailleurs que 5 % des voix de À se reporteront 
sur B et que 10 % des voix de B iront à À. On estime de plus que les deux tiers des 
électeurs n'ayant pas voté au premier tour voteront, à raison de 60% pour À et 
40 % pour B. 
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a) Quelle est la probabilité pour qu'un abstentionniste du premier tour vote 
pour A? pour B? 


b) D'après ce sondage, quel candidat a la plus forte probabilité d’être élu ? 


Analyse de l'énoncé et conseils. Les résultats du premier tour se traduisent en termes 
de probabilités et les éléments du sondage en termes de probabilités conditionnelles 
au vote du premier tour. On doit ensuite calculer les probabilités conditionnelles à 
l’abstention au premier tour et en déduire la probabilité du vote au second tour, pour 
chacun des candidats. 


Théorème de Bayes 


30. On classe les gérants de portefeuille en deux catégories : ceux qui sont bien 
informés et ceux qui ne le sont pas. Lorsqu'un gérant bien informé achète une 
valeur boursière pour son client, la probabilité que le cours de celle-ci monte est 
de 0,8; dans le cas d’un gérant mal informé, cette probabilité ne vaut que 0,5. Si 
on choisit au hasard un gérant dans un annuaire professionnel, la probabilité qu'il 
soit bien informé est de 0,2. Calculer la probabilité que le gérant ainsi choisi soit 
mal informé, sachant que la valeur qu'il a achetée a monté. 


Analyse de l'énoncé et conseils. C’est une application directe du théorème de Bayes. 


31. Dans la coupe de France de football, une équipe E de première division 
estime qu’elle gagnera si elle rencontre une équipe de division inférieure et qu’elle 
a une chance sur deux de gagner si c’est une équipe de première division. Sachant 
que la probabilité de rencontrer une équipe de division inférieure est p, calculer la 
probabilité que E ait rencontré une équipe de division inférieure, sachant qu’elle 
a remporté son match. 


Analyse de l'énoncé et conseils. Après avoir traduit en termes de probabilités les 
informations fournies dans l'énoncé, on applique la formule de Bayes. 


SOLUTIONS 
€. 


€ 


1 > Vrai. L'ensemble Q dépend évidemment de l'expérience considérée, mais aussi 
du choix de celui qui construit le modèle, et par là présente donc un certain arbi- 
traire. L'ensemble fondamental naturel associé à un jet de dé est @ = {1,2,3,4,5,6}, 
mais si on ne s'intéresse qu’à la parité du résultat, on peut retenir également 
Q = {{1,3,5},(2,4,6}}. 
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2 » Faux. Il suffit que P(A N B) = 0, ce qui est différent de À N B = ÿ. Soit par 
exemple Q = {a,b,c} avec P({a}) = P({b}) = 1/2 et P({c}) = 0; les deux événements 
A = {a,c} et B = {b,c} ne sont pas disjoints car {a,c} N {b,c} = {c} et pourtant 
P(AU B) = P(Q) = 1 = P(A) + P(B). 


3 > Faux. La probabilité de tirer une boule rouge au deuxième tirage sans remise 


2. 1 1 
dans une urne qui contient deux noires et une rouge est P(A) = RE nr alors 


que si l'événement B = « tirer une boule rouge au premier tirage » est réalisé, on a 
bien sûr P(A|B) = 0. 


4 » Faux. L'incompatibilité se traduit par P(A N B) = 0 et l’indépendance par 
P(ANB) = P(A)P(B), produit en général différent de 0, sauf cas particulier où l’un 
des deux événements est de probabilité nulle. 


5 »> Vrai. Si les événements À et B sont indépendants, on obtient : 


P(ANB) = P(A) — P(ANB) = P(A) — P(A)P(B) 
= P(A)[1-—P(B)] = P(A)P(B) 


donc les événements À et B sont indépendants. De même : 
P(A NB) = P(B) — P(AN B) = P(B) — P(A)P(B) 
= P(B)[1— P(A)] = P(À)P(B) 


donc À et B sont aussi indépendants. 


6 > Faux. En raison de l’'équiprobabilité : P(A) = P(B) = 1/2 et P(ANB) = P({a}) = 
1/4 = P(A)P(B), donc les événements À et B sont indépendants. 


7 » L'événement noté PF peut être obtenu de deux façons différentes, le résultat 
pile par exemple pouvant apparaître sur l’une ou l’autre des deux pièces ; sa pro- 
babilité est donc 2/4. Les événements PP et FF par contre ne peuvent être obtenus 
que d’une seule façon (leur probabilité est 1/4) ; il n’y a donc pas équiprobabilité 
des résultats possibles retenus. Ceci peut être source d’erreur dans le calcul des 
probabilités et il vaut mieux retenir ici l’ensemble fondamental @ = {P,F 2, c'est- 
à-dire l’ensemble des couples ordonnés, chaque élément du couple étant associé à 
une pièce particulière, même si les pièces sont identiques. 


8 > Pour que le produit soit impair, il faut que chacun des nombres soit impair. Le 


LAS LT 
sujet qui connaît le calcul des probabilités sait donc que P(impair) = ie 6 
et il choisira donc d’être pendu (événement noté PE) si le résultat est impair. Dans 
le cas contraire, le choix pair (P) ou impair (1) se fait au hasard, la probabilité d’être 


pendu étant alors calculée par la formule de la probabilité totale : 
1 


P(PE) = P(P)P(PE|P) + P(DP(PEID) = : sir, ; = 


1 
8 2 2 


D'où l'intérêt parfois de connaître le calcul des probabilités ! 
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9 > I suffit d'appliquer la formule de Bayes et de remarquer que À € AUB: 


P(A) P(A) 
PAAUB) = > = 
AAUB = 0 P+rE-ranB = 74 
Savoir que À ou B est déjà réalisé augmente la probabilité de A. 


Si À et B sont réalisés, l'événement À l’est bien sûr et on peut vérifier que 
P(AJANB) = 1. 


En appliquant à nouveau la formule de Bayes : 


P(ANB) P(AUB) 1-—P(AUB) __P(B)- P(ANE) 


A 
P(A) P(À) 1— P(A) 1 — P(A) 


Si À et B sont indépendants, on a vu dans l'exercice 5, page 5, que À et B sont aussi 
indépendants, ce que l’on retrouve ici en obtenant dans ce cas P(B|A) = P(B). 


10 > Par hypothèse, il y a équiprobabilité sur @ = {FF,FG,GF,GG}. 


a) Onconditionneici par l'événement À = {FF,EG, GF} et la probabilité demandée 
se calcule par : 


P(FF) 1/4 1 


P(A) 3/4 3 


P(FF|A) 


b) La différence avec le cas précédent peut ne pas apparaître immédiatement car 
l'événement B = «une fille vient ouvrir » implique évidemment que l’un au moins 
des enfants est une fille. Mais il y a un élément supplémentaire d’information 
qui va renforcer cette probabilité conditionnelle : la fille s'est déplacée pour venir 
ouvrir. Si on admet que fille et garçon ont la même curiosité de venir ouvrir, on 
obtient ici : 


1 1 2 
P(B)= 5P(FG) + 5P(GP)+ P(FP) = © < P(4) 


et donc 


P(FF) 1/4 
P(B) 2/4 


P(FF|E) 1/2 > P(FFIA) 


11> a) Les deux dés étant distincts, un événement élémentaire est représenté 
par un couple ordonné w = (1,2) où x1 (resp. x2) représente le chiffre obtenu sur 
le dé rouge (resp. bleu). Ainsi  — E? avec E = {1,2,3,4,5,6)} et card Q = 36. 


b) Les dés étant identiques, l’ensemble fondamental est constitué par les couples 
6x5 6x7 
= =:21, 
2 2 


c) Si on note I (resp. P) un résultat impair (resp. pair) sur un dé, l’ensemble 
fondamental se réduit ici à Q = {IP, PP, If} soit card & — 3. 


non ordonnés d'éléments de E, avec ici card R = 62? 
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12 > a) Un événement élémentaire est caractérisé par le numéro C;, 1 < i < 4, 
de la case où a été lancée chacune des boules. Il s’agit donc d’une application w de 
E = {1,2,3,4,5,6} dans F = {C1,C2, C3, Ca} avec card & = 4$. 


b) Si les boules sont identiques, un événement élémentaire est caractérisé cette 
fois par le nombre x;, 1 < i < 4, de boules tombées dans la case i, et : 


4 
a = fans N<x<6,ÿ = à 
1 


Le cardinal de @ est égal au nombre de combinaisons avec répétitions (cf. complé- 
ments du chapitre 1 du livre Statistique et Probabilités, Lecoutre, Dunod, 3° ed, 2006) 


6+4-—T 9 
de 6 éléments choisis parmi 4, soit card Q = ( Ÿ 6 } ( . = 84. 


13 » a) À chaque lancer est associé l’ensemble fondamental E = {P,F} et aux six 
lancers Q = Ef. 


b) Un événement élémentaire est caractérisé par le nombre n: de résultats P 
obtenus et dans ce cas Q = {0,1,2,3,4,5,6}. Le nombre de résultats F étant bien 
sûr M = 6 — M. 


c) Le total obtenu a pour valeur #1 — n2 = 2n1 — 6, ce qui conduit à @ — 
{—6, —4, —2,0,2,4,6}. 
14 > Par définition de la différence symétrique : 


E=[AUB)NCIUIAUBNC]=(ANOUBNOUANBENC) 


L'événement À N C par exemple n’est pas un atome et se décompose à l’aide du 
troisième événement B en ANBNC et ANBNC. On obtient donc la décomposition 
en atomes : 


E=(ANBNOU(ANBNOU(ANBNOU(ANBNC) 
Par le même procédé, on aboutit à : 


F=(ANBNCU(ANBNOU(ANBNOC) 
U(ANBNOU(ANBNOU(ANBNO) 


Figure 1.1 
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On voit ainsi que F = EU (ANC), donc pour que F soit identique à E il faut que 
ANC = ÿ, c'est-à-dire que À et C soient incompatibles. 


15 > L’algèbre À contenant {c} et {d} doit contenir aussi leur union {c,d} et 
leurs complémentaires {a, b,d} et {a, b,c}. La fermeture pour l'intersection implique 
qu'elle contienne aussi {a,b,d} N {a,b,c} = {a,b}. Au total on obtient : 


A = {9,{c},{d}, {cd}, {a,b},{a,b,d} , {a,b,c},Q} 
On peut vérifier qu’il s’agit bien d’une algèbre à 28 éléments. 


16 » L'algèbre 4 engendrée par la partition est constituée par les 24 réunions des 
ensembles de cette partition, soit : 


À = {9, {a}, {b, c} 2 {d} 2 {e} , {a,d} 2 {a,e} , {d, e} , {a, b, c} 2 
{a,d,e} ,{b,c,d} ,{b,c,e} {a,b, c,d} , {a,b,c,d,e} ed A} 


17 » Tous les ensembles Q étant finis, les algèbres que nous allons construire 
seront aussi des o-algèbres. 


a) Iln’y a que l'algèbre élémentaire 4 — {ÿ, Q}. 


b) Il n'y a que l'algèbre élémentaire 4 = {ÿ,Q} et l'algèbre la plus complète 
P (Q) = {4, {a}, (b},Q}. 


c) On peut construire ici cinq algèbres, de la plus élémentaire 41 = {ÿ,@} à 
la plus complète P (Q) = {ÿ,{a},{b},{c},{a,b},{b,c},{a,c},}, en passant par 
les algèbres à quatre éléments 42 = {ÿ,{a},{b,c},Q}, A3 = {9,{b},{a,c},Q} et 
Aa = {,{c},{a,b}, 8}. 


18 > L'algèbre A est engendrée par la partition de Q constituée des quatre atomes 
formés à partir de À et B, soit II = {ANB,ANB,ANB, ANB)}. Elle comporte 24 = 16 
éléments : 


ie [9,4,B,A,B,A nBAnB,.AnB An, 


AUB,AUB,AUB,AU B,AAB,AAB, ©] 


19 » L'ensemble € est non vide car il contient Q, puisque Q = f est dénombrable 
(card Ÿ = 0). Par ailleurs, il est par définition fermé pour le passage au complé- 
mentaire. Enfin, soit À, € © pour tout entier n; si A, est dénombrable pour tout n, 
alors il en est de même de l’union dénombrable U,enA, qui est alors un élément 
de €. S'il existe un entier n, tel que À,, n’est pas dénombrable, c'est donc que son 
complémentaire l’est, et par conséquent Un A = Nyen An C An est dénombrable. 
Dans tous les cas il y a fermeture pour l’union dénombrable, ce qui finit de prouver 
que € est une tribu. 
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20 » Les événements considérés sont E = AU B et F = (AN B)U (AN B) dont les 
probabilités se calculent par : 


P(E) = P(AUB) = P(A) + P(B) — P(AN B) = . 


PCF) = PA NE) + PA NB) = PE) — PANB) = à 


21 > Le premier événement s'écrit : 
A = (ENENE3)U(ENENEs)U(ENENE;) 
Sa probabilité se calcule à partir de : 


P(E1 N EN E3) = P(E1 N E>) — P(E1 N EN E3) 


pay-(24_10),f15 101,12 10\ 21 
= (66 — 100 100 100 100 100/ 100 


Le deuxième événement s'écrit : 


Soit : 


B= (EANENE)U(ENENES) UE NENES) 
Sa probabilité se calcule à partir de : 


P(E1 N E2 0 Ë3) = P[E1 N Œ2 U E3)] = P(E1) — P[E1 N (EU E3)] 
= P(E:1) — P(E1 NE) — P(EN Es) + P(EN EN E3) 


Soit : 


60 40 30 2 24 15 12 10 58 
100 100 


PB)=—+—+:— EE — 
® 100 * 100 * 100 100 100 100 


Le troisième événement s'écrit C = E1 N E2 N Es, de probabilité : 


11 
P(C) = 1 — P(A) — P(B) — P(E1N EN E3) = TS 


22 » a) Sion note J (resp. F) l'événement « l'étudiant fournit une réponse juste 
(resp. fausse) », l'événement considéré correspond à trois ou quatre réponses justes, 
soit : 


E = (FJJ}) U GEJP 0 (JEJ) U (JJP) U (IP) 


Comme il y a équiprobabilité sur l’ensemble fondamental & = {],F}* et indépen- 
dance des choix à chaque question, la probabilité demandée est : 


nai à = 
PR É + (3 9 
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b) S'il n’y a que deux réponses possibles, cette probabilité devient : 


ot 1 ee 
FTFals 2) 16 


Avec quatre réponses possibles : 


n _ 43 ie 
Pal 4) 256 


On a bien sûr p' > p > p”. 


23 » Soit P(A) la probabilité de gain du joueur A au début du jeu et examinons 
ce qu’elle devient après les deux premières parties. Si À gagne les deux parties, 
cette probabilité est devenue égale à 1, et à 0 s’il les a perdues. S'il gagne une seule 
partie elle est inchangée. On a donc la relation : 


P(A) =1 x p° +0 x g° + P(A) x pq + P(A) x qp 


D'où on déduit : 


2 2 
pote EE = ee 
l—2pq p°+q 
Par conséquent : 
g 
P(B) = 1 — P(A) — 
(B) (A) P+p 
A 1 
P 
A 
P 
TN B [P& 
P(A) 
A | P(A) 
q P 
B 
FN ST 
Figure 1.2 


24 » I y a équiprobabilité des événements élémentaires de l’ensemble fondamen- 
tal R = {1,2,3,4,5,6}° de cardinal 65. La probabilité d’un événement quelconque 
cardA 

card 

a) L'événement considéré est de la forme aa, où il y a six choix possibles pour le 
chiffre 4. Sa probabilité est donc : 


A se calcule donc par P (A) = 


6 1 
P (aaa) = & — 3% 
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b) Ils’agit cette fois d’un événement de la forme aab, avec six choix pour le chiffre 
a, cinq choix pour b et trois possibilités pour la place du résultat b, donc : 


6x5 15 


P(aab) = 3  — % 


c) Un résultat quelconque de la forme abc correspond à une permutation sans 
répétition de trois chiffres choisis parmi six, soit : 


6x5x4 20 
PGO == 


On vérifie bien que la somme de ces trois probabilités est égale à 1. 

25 » ll ya équiprobabilité de chaque événement élémentaire qui correspond à une 

main de cinq cartes, 1.e. à une combinaison sans répétition de cinq cartes choisies 
32 ; 

parmi 32. Le cardinal de l’ensemble fondamental est donc é = 201376 et il 

va falloir maintenant dénombrer les différentes mains proposées. Une paire est 


4 
déterminée par le choix de la hauteur (il y en a 8) avec () choix possibles pour les 


7 
couleurs. Il y a ensuite 4 hauteurs des cartes d'accompagnement et 4° couleurs 


possibles. Le nombre total de paires est donc le produit de ces différentes valeurs, 


4 7 
soit 8 x () x () x 4 = 107520 et : 


107 52 . 
__ + 


he 
Qabcd) = 37e — 309 


Hya () choix pour les hauteurs des paires avec () choix de couleurs pour 
chacune et il reste ensuite 6 choix de la hauteur de l’autre carte, avec 4 choix de 
couleurs, soit un nombre total de doubles paires égal à () x () x () x6x4= 
24192. Aïnsi : 


24192 108 
P(aabbo) = == 040 
Qabbo) = 37e — 800 


4 
Enfin, il y a 8 choix de hauteurs pour 4 avec (:) = 4 choix de couleurs, 7 choix 


4 
de la hauteur de la paire et 2h 6 choix pour la couleur, soit un total de 


8 x 4x7 x 6 = 1 344 fulls. On obtient donc : 


134 6 he 
201376 899 ” 


P(aaabb) = 
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26 > Chaque ensemble de 2r gants pris au hasard parmi les 2n gants contenus dans 
2n 

le tiroir a la même probabilité 1 / G ) . Pour qu'aucune paire ne soit appareillée, il 
r 

faut que les 2r gants aient été choisis parmi les n paires diférentes, ce qui correspond 


n . De 
à L ) possibilités. Mais, chacun de ces gants peut être soit Le droit, soit le gauche, 
r 


soit un total de 22?’ o choix dépareillés. La probabilité demandée est donc : 


22r Le 
2r 


2n 
2r 
ne 2 
Pour ñn = 2etr = 1 par exemple, cette probabilité vaut - 


27 » On note A l'événement « la lettre est dans le quatrième tiroir » et B l’évé- 
nement « la lettre n’est pas dans les trois premiers tiroirs ». La définition de la 
probabilité conditionnelle conduit à : 


P(ANB) 


P(AIB) = 


Chaque tiroir a la même probabilité de contenir la lettre, si celle-ci est dans l’un 

1 - 
d’entre eux, donc P(ANB) = p x 2 On calcule ensuite P(B) = P(ANB) + P(ANB) 
avec bien sûr P(ÀA NB) = 1 — p. Ainsi: 


p/4 p 
PAIB) = = — 
(AIB) p/4+1—-p  4—3p 


Notons que p/4 < P(AIB) < p avec P(A]IB) = 0 sip = 0 et P(AÏB) =1sip = 1. 


28 > Avec des notations évidentes, la première probabilité s'écrit : 


P(U:) 1/3 1 


PIB U D) = PUS — 1541 2 


La deuxième probabilité demandée s'écrit : 


L PURON) 2 PDP 
FN EG  PUDPANIU + PU)P NID) 
1 x 1/3 2 


" 1IKIBFIPxIE 3 


On voit ainsi que les deux probabilités sont distinctes. L'information du tirage 
d’une boule noire implique bien sûr la présence d’une boule noire mais ne se 
confond pas avec cette dernière information. Ceci démontre la nécessité d’une très 
grande rigueur dans la définition d’un événement et l’aide que peut apporter la 
formalisation dans le calcul d’une probabilité. 


20 TD Statistique et probabilités 


29 » Soit Ai (resp. B;), i = 1,2, l'événement « voter pour le candidat À (resp. B) 
au i-ème tour » et O; l'événement « s'abstenir au i-ème tour ». Les informations 
fournies dans l'énoncé se traduisent par les probabilités suivantes : 


P(A;) = 0,40 P(B:) = 0,45 P(O:) = 0,15 
P(B2|A:1) = 0,05 P(A2|B1) = 0,10 P(O>|O:1) = 2/3 
P(A21O1 NO) = 0,60 P(B21O1 NO) = 0,40 


a) Les événements demandés s’écrivent A|[O1 et B>|[O1, leurs probabilités se 
calculant par : 


_ — 2 
P(A2101) = P(O2101)P (42101 N O2) = 0,60 x 3 0,40 


= — 2 4 
P(B210:1) = P(O2101)P(B2101 N O2) = 0,40 x a 


b) Calculons par exemple : 


P(A2) = P(A1)P(A2lA1) + P(B1)P(A21B1) + P(O1)P(A21O:) 
= 0,95 x 0,40 + 0,10 x 0,45 + 0,40 x 0,15 = 0,485 


On obtient de la même façon P(B2) = 0,465, ce qui montre que les abstentionnistes 
apporteront la victoire au candidat À. 


30 > Notons MI (resp. BI) l'événement « le gérant est mal (resp. bien) informé » et 
M l'événement « la valeur a monté ». Les hypothèses formulées se traduisent par 
les probabilités P(BD) = 0,2, P(MIBD = 0,8 et P(MIMT) = 0,5. On obtient alors par 
application de la formule de Bayes : 


pas = OMOND PORC 
PM) PMDP(MIMD + P(BDP(MIBD) 
0,8 x 0,5 5 


7 08x05+02x08 7 


31 > Soit A l'événement «l’équipe E a rencontré une équipe de première division » 
et G l'événement « l’équipe E a gagné son match ». Par hypothèse P(À) = p, 
P(A) = 1 —p, P(G|A) = 1/2 et P(GIA) = 1. La formule de Bayes permet alors 
d'obtenir : 


P(ANG) P(A)P(G|À) p 2p 


P(AIG) = —=——"° — = ee, 
AD Ho —PAPGA+PAPCA  U=p2tP pl 


Le résultat est une fonction croissante de p, de la valeur 0 pour p = 0 à la valeur 1 
pour p=l. 
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| Variable 
aléatoire 
discrète 


(1 L'ESSENTIEL DU COURS 


Chaque résultat d'une expérience aléatoire est codé au moyen d'une application qui, si 
elle permet d'associer une probabilité à chacune de ses valeurs numériques discrètes, sera 
appelée variable aléatoire discrète. La loi de cette variable aléatoire est alors déterminée 
par les probabilités de toutes ses valeurs possibles. Elle est souvent caractérisée par les 
deux premiers moments qui sont l'espérance, caractéristique de valeur centrale, et la 
variance, caractéristique de dispersion autour de cette valeur centrale. Nous présenterons 
les principales lois de probabilité discrètes. 


1. Variable aléatoire réelle discrète 
1.1 Définition 


On appelle va. discrète définie sur (Q,.4) une application X : @ — R telle que 
X(Q) est dénombrable, 1.e. en correspondance bijective avec N, et telle que pour 
tout x réel : 


Xl (x) = {w € R/X(w) = x} € A 


ce qui exprime tout simplement que X-!(x) est un événement. 


1.2 Loi de probabilité 
La probabilité notée Px, définie sur Q’ = X(Q) et définie par : 
Px(X = x) = P{X7(x)} = P{w € R/X(w) = x} 


s'appelle la probabilité image de P par X. L'ensemble Q’ étant dénombrable, il existe 

une bijection permettant de représenter ses éléments par l’ensemble des x;, i € N. 

La loi de probabilité est alors définie par les probabilités individuelles : 
pi=PxX=x)=P{X (x)}, ieN 


On appelle alors distribution ou loi de probabilité de X l’ensemble des couples 
(x, Pi)ien- 
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1.3 Fonction de répartition 
On appelle fonction de répartition de la v.a. X, la fonction F définie pour x réel par : 
F(x) = Px{X < x} = +, {pi/xi < x} 


Cette valeur représente la probabilité de toutes les réalisations strictement infé- 
rieures au réel x. 


1.4 Moments d'une v.a. discrète 


> Espérance mathématique 


Définition. On appelle espérance mathématique de la v.a. X la quantité, si elle existe : 


EX) = ÿ_pax 


ieN 


Propriétés. Si on ajoute une constante à une v.a., il en est de même pour son 
espérance : 


E(X+a)=E(X)+a VaeR 
Si on multiplie une v.a. par une constante, il en est de même pour son espérance : 
E(aX) = aE(X) VaeR 
L'espérance d’une somme de deux v.a. est la somme des espérances : 
E(X + Y) = E(X) + E(Y) 
On résume ces trois propriétés en disant que l'opérateur espérance est linéaire : 
EAX+UY =XED+UEM)  VReR, VueR 


> Variance 


Il s'agit d’un indicateur mesurant la dispersion des valeurs x; autour de E(X) : 


VO = Ÿ_pilxi - EDP 


ieN 


lorsque cette quantité existe. Elle s'écrit aussi : 


V(D = E[X- EXP =E(X) -E(X 


On note encore cette quantité V(X) = 0%, ox désignant alors l'écart type de la va. X. 
Propriétés. Par définition : 


V(X) > 0 
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Pour tout réel 4 : 
V(X + a) = V(X) 
Pour tout réel 4 : 
V(aX) = &V(X) 
Si X et Y sont deux v.a. indépendantes, alors : 
VX + Y) = VX) + VM) 


On définit la covariance de deux va. X et Y par Cov(X, Y) = E(XY) — E(X)E(M) et 
on a, dans le cas général : 


V(X + Y) = V(X) + V(N) +2 CoviX, Y) 


> Moments non centrés et centrés 
On appelle moment non centré d'ordre r € N* la quantité, lorsqu'elle existe : 
mO0= Y pe = É00) 
ieN 
Le moment centré d'ordre r € N* est: 


ur(X) = ÿ_pilx - EC) = E[X-E(X)} 


ieN 


2. Lois usuelles discrètes 
2.1 Loi de Dirac 


Soita € R un point fixé. On appelle loi de Dirac la loi de la v.a. certaine X, c'est-à-dire 
qui est constante, avec X(w) = 4 quel que soit le résultat w de l'épreuve. Ainsi : 


X(Q) = {a} et Px(X = a) = P{w e Q/X(w) = a} = P(Q)=1 


Bien entendu, on obtient comme moments E(X) = a et V(X) = 0. 


2.2 Loi de Bernoulli 


On appelle v.a. indicatrice de l'événement À de 4, la va. définie par X = 14 : 


1 siweA 
X = 1 = = 
De L si we À 
Ainsi X(8) = {0,1} avec Px(X =0) = P(A) = 1 — P(A) = g et Px(X=1) = 
P(A) = p. On dit que X suit une loi de Bernoulli de paramètre p, ce qu'on écrit 
X + 8(1,p), de moments E(X) = p et V(X) = pq. 
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2.3 Loi binômiale 


On effectue n épreuves successives indépendantes où on observe à chaque fois la 
réalisation ou non d’un certain événement À, et on note le nombre X de réalisations 
de À. On définit ainsi une va. X qui suit une loi binômiale de paramètres n et 
p = P(A), caractérisée par X(Q) = {0,1,...,n} et, pour k e X(Q), par: 


Px(X = D = (7) Pia = py'* 


On écrit X -+ B(n,p) avec E(X) = np et V(X) = npq. Si X1 — B(m,p) et 
X2 + B(m,p), les va. X1 et X2 étant indépendantes, alors X1 + X2  B(n1 + n2,p). 


2.4 Loi hypergéométrique 


On effectue n tirages sans remise dans une urne contenant N objets dont NA objets 
À et on note X le nombre d'objets À tirés. Pour tout k tel que 0 <k <n: 


GC) 
k n—k 
Px(X =) = IN — 
n 

La loi hypergéométrique s'écrit symboliquement X - Æ(N,n,N4), de moments : 

ED = np. VOD = pq 

D 

ayant posé p = P(A) = N4/Netq=1-p=1-Na/N. 
2.5 Loi de Poisson 


Une v.a. X suit une loi de Poisson de paramètre x > 0 si c'est une variable à valeurs 
entières, X(Q) = N, avec pour k € N: 
k 


À 
Px(X = k) =. 


On utilise l'écriture symbolique X ++ ÆP(X) et le calcul des moments donne 
E(X) = V(X) = à. Si deux variables suivent des lois de Poisson et sont indépen- 
dantes, X - P(X) et Y — P(I1), alors leur somme suit aussi une loi de Poisson : 
X+Y = PRA+U). 


2.6 Loi géométrique ou de Pascal 


On effectue des épreuves successives indépendantes jusqu’à la réalisation d’un 
événement particulier À et on note X le nombre d'épreuves effectuées ; pour k € N*: 


Px(X = k) = (pp 


1 
où p = P(A) avec EX = = et V(X) = 2 q=1-p. 
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2.7 Loi binômiale négative 


On effectue des épreuves successives indépendantes jusqu'à ce que 7 événements 
A soient réalisés et on note YŸ le nombre d'épreuves effectuées. Pour tout entier 
y>n: 


” 
PyY = y) = (! e ;}p"a — p}/" où p = P(A) 


avec comme moments E(Y) = - et V(Y) = a g=1-p: 


() POUVEZ-VOUS RÉPONDRE ? 
SE ———— 


Vrai Faux 
1. Une variable aléatoire est une valeur numérique. CO O 
2. Toute application de P(Q) dans N est une variable aléatoire 
discrète. 0 
3. L'espérance mathématique d’une va. discrète est la valeur 
qu'elle prend le plus fréquemment. [] (n 
4. L'espérance mathématique d’une somme de deux v.a. discrètes 
est toujours la somme de leurs espérances. CO CI 
5. Si deux va. ont la même espérance, alors elles ont la même 
variance. Û] (n 
6. La variance d’une somme de deux v.a. discrètes est toujours la 
somme de leurs variances. CO CO 


[p 
le QUESTIONS DE RÉFLEXION 


7. Une urne contient trois billes numérotées 1, 2,3, celle portant le n°1 étant la 
seule en métal. On retient donc sur l’ensemble fondamental @ = {1,2,3} la tribu 
associée À = {9,{1}, {2,3}, @}. Si on extrait une bille de cette urne au moyen d’un 
aimant, déterminer la probabilité P associée à cette expérience. On considère alors 
l'application identité X sur { et l'application Y définie par Y (w) = 1 pour tout w 
de ©. Établir que P(X = Y) = 1 et que pourtant on ne peut pas en conclure que X 
et Ÿ ont la même loi de probabilité. 
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8. Si X et Y sont deux va. indépendantes qui admettent une variance, on sait que 
V(X + Y) = V(X) + V(Y). Dans quel cas peut-on avoir la relation V(X — Y) = 
VX) — V(Y)? 


9. Un examen comporte n questions qu’un candidat tire au hasard dans le pro- 
gramme, avec remise. On note X la va. qui représente le nombre de questions 
tirées dont il connaît la réponse et Y celle qui représente le nombre de celles dont 
il ignore la réponse. Si p est la proportion de questions du programme que ce 
candidat connaît, calculer V(X), V(Y) puis V(X + Y). Que remarque-t-on? 


1 ENTRAÎNEMENT 


Loi de probabilité 


10. On considère une urne contenant une boule blanche et deux boules noires 
identiques. On effectue deux tirages successifs dans cette urne, la première 
boule tirée étant remplacée par une boule de couleur différente. On demande 
de construire l’ensemble fondamental Q associé à cette épreuve aléatoire, si on 
tient compte de l’ordre des tirages, et de déterminer la probabilité de chacun des 
événements élémentaires. En déduire la loi de probabilité de la v.a. X qui représente 
le nombre de boules noires tirées. 


Analyse de l'énoncé et conseils. Dans tout problème de tirages successifs, il est 
important d'établir s'ils sont indépendants ou non. Pour la construction de l’ensemble 
fondamental associé, il est recommandé de toujours tenir compte de l’ordre des tirages, 
même dans le cas où cela n’a aucune influence sur les événements considérés, car cela 
facilite généralement le calcul des probabilités de ceux-ci. La loi de probabilité d’une 
va. discrète X se déduit des probabilités des événements élémentaires, en déterminant 
pour toutes ses valeurs possibles x l’ensemble X-1 (x) des événements élémentaires 
auxquels correspond cette même valeur x. 


11. Une urne contient six boules dont quatre blanches et deux noires. On extrait 
une boule de l’urne, puis on la remet et on effectue ensuite des tirages sans remise 
jusqu'à obtention d’une boule de même couleur. Déterminer la loi de probabilité 
du nombre X de tirages après remise de la boule tirée initialement. 


Analyse de l'énoncé et conseils. Comme dans l'exercice précédent, on note que la 
composition de l’urne évolue au cours des tirages qui sont sans remise, donc dépen- 
dants. Pour déterminer la loi de X, il faut d’abord déterminer l’ensemble de ses valeurs 
possibles et ensuite leurs probabilités. Pour cela, il est conseillé de distinguer deux cas 
selon le résultat du tirage préliminaire, c’est-à-dire de déterminer la loi conditionnelle, 
puis de regrouper ces deux cas en appliquant la formule de la probabilité totale vue au 
chapitre précédent. 
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Espérance mathématique 


12. Un joueur paie une mise de cent francs pour participer à un jeu où il doit 
obtenir deux résultats pile successifs en quatre lancers au plus d'une pièce de 
monnaie. Son gain est alors G = 20 #- X pour un nombre aléatoire X de lancers. 
Calculer son espérance de gain. 


Analyse de l'énoncé et conseils. Une espérance mathématique se calcule par rapport 
à une loi de probabilité. Comme G est fonction de X qui est une va. c’est aussi une va. 
Pour chaque valeur possible x de X, il faut calculer la valeur correspondante du gain 
G et multiplier par la probabilité du résultat conduisant à ce gain et qui ne sera pas la 
probabilité de la valeur x. En effet, l'expression de G ne correspond qu'aux résultats 
qui se terminent par deux pile. 


13. Un garagiste commande au constructeur N voitures, le nombre aléatoire X de 
voitures qu'il peut vendre dans l’année étant l’un des entiers de 0 à n, tous ayant 
la même probabilité, où n est un entier fixé tel que n > N. Toute voiture vendue 
rapporte au garagiste un bénéfice a et toute voiture invendue entraîne une perte 
b. Calculer l'espérance du gain G du garagiste et en déduire ce que doit être sa 
commande optimum. 


Analyse de l'énoncé et conseils. Il faut au préalable exprimer le gain en fonction de X 
et son espérance va ensuite être calculée par rapport à la loi de X qu'il faut déterminer 
en tenant compte des éléments fournis par l'énoncé. Une commande est optimum si 
elle rend maximale cette espérance. 


Loi de probabilité et moments 


14. Une va. X peut prendre l’une des trois valeurs 0, 1 ou 2 avec des probabilités 
peut p P 
positives. Déterminer sa loi de probabilité sachant que E(X) = 1 et V(X) = 1/2. 


Analyse de l'énoncé et conseils. L'expression des deux premiers moments non centrés 
à l’aide des probabilités individuelles va nous fournir deux relations qui lient ces trois 
valeurs. La troisième permettant de les déterminer s'obtient à partir de la condition 
générale relative à une loi de probabilité. 


15. Un jouet se trouve caché dans l’une des N boîtes fermées où un enfant le 
cherche. Celui-ci ouvre une boîte au hasard et recommence jusqu’à ce qu'il trouve 
le jouet. On suppose qu’à chaque tentative il a oublié le résultat de toutes les 
précédentes. Déterminer la loi de probabilité de la va. X égale au nombre de 
tentatives effectuées jusqu'à la découverte du jouet, puis calculer son espérance. 
Préciser le nombre No de boîtes si l'enfant a environ trois chances sur quatre de 
trouver le jouet à l'issue de ses trois premières tentatives. 


Analyse de l'énoncé et conseils. On reconnaîtra dans le descriptif de l'expérience le 
schéma d’une loi usuelle et il suffira d'appliquer la formule du cours pour le calcul de 
l'espérance. La valeur de la probabilité que X soit inférieure ou égale à 3 étant fixée à 
0,75 environ, ceci va déterminer l’entier No auquel est associée une valeur proche. 
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Loi du maximum 


16. Dans une urne qui contient N boules numérotées de 1 à N, on en extrait avec 
remise n. Déterminer la loi de probabilité de la va. X égale au plus grand des n 
numéros tirés. 


Analyse de l'énoncé et conseils. Les tirages étant avec remise sont indépendants. Il est 
facile de voir que X peut prendre toutes les valeurs entières de 1 à N. Pour déterminer 
la probabilité d’un entier k donné, il est conseillé de calculer d’abord la probabilité de 
l'événement X < k puis de remplacer k par k — 1. 


17. La va. X représente le chiffre obtenu après le lancer d’un dé à six faces 
numérotées de 1 à 6. Déterminer la loi de probabilité de la va. Y = X (7 — X) puis 
calculer E(Y) et V(Y). On désigne par Y1,..., Y, les valeurs observées à l'issue de 
n lancers indépendants. Déterminer la loi de probabilité de la va. M, égale à la 
plus grande de ces valeurs. 


Analyse de l'énoncé et conseils. La loi de Y se déduit de celle de X en calculant la 
valeur obtenue pour chaque valeur possible de X. Pour déterminer ensuite la loi du 
maximum, il faut exprimer l'événement M, = kà l’aide d'événements portant sur les Y;, 
en faisant parfois intervenir l'événement complémentaire et en se rappelant que toutes 
les va. Y; sont indépendantes et de même loi. Par ailleurs, il est conseillé de commencer 
par les valeurs de k qui correspondent aux événements les plus simples à exprimer. 


Lois usuelles 


18. On désigne par X la va. qui représente le nombre de boules rouges obtenues 
après cinq tirages avec remise dans une urne qui contient deux boules rouges et 
six boules blanches. Déterminer sa loi de probabilité puis calculer E(X) et V(X). 


Analyse de l'énoncé et conseils. Il est facile de reconnaître ici une loi usuelle dont les 
moments sont donnés par le cours. 


19. On désigne par X la va. qui représente le nombre de boules blanches obtenues 
après trois tirages sans remise dans une urne qui contient deux boules noires et 
huit boules blanches. Déterminer sa loi de probabilité puis calculer E(X) et V(X). 


Analyse de l'énoncé et conseils. Voir exercice précédent. 
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SOLUTIONS 
€ 


€ 


1 > Faux. Une variable aléatoire est une application qui à un événement fait 
correspondre un nombre. 


2 > Vrai. Si on prend comme tribu A4 = P(Q), toute application X est une va. 
puisque X-!(x) € P(Q) pour tout x réel. 

3 > Faux. C'est simplement la moyenne en probabilité de toutes ses valeurs pos- 
sibles et ne correspond d’ailleurs pas forcément à l’une des valeurs qu’elle peut 
prendre. Par exemple, si X est la v.a. qui code 0 le résultat pile et 1 le résultat face 
d’un lancer de pièce de monnaie : 


1 ÿ 
E(X) = 0 x Px(X = 0) +1 x Px(X= 1) =0x 2 +1Xx5 = 


La valeur moyenne en probabilité de X est 1/2, bien que X ne prenne jamais cette 
valeur. 


4 » Vrai. La seule condition est bien sûr que l'espérance de chacune de ces deux 
variables existe. 


5 > Faux. Une espérance commune n’a aucune incidence sur la valeur de la 
variance. Considérons par exemple les deux distributions suivantes : 

X 4 9 12 Ve © 6 

DATA 2 VENTE 

Elles ont comme valeurs moyennes : 

E(X)=1+2+6=9 et EY)=-4+2+11=9 
donc même centre de distribution. Par contre : 

E(X)=4+16+72=92 et E(Y?) = 32+12 +726 = 770 


d'où V(X) = 11 et V(Y) = 689, valeur très supérieure qui indique une dispersion 
de Ÿ autour de sa moyenne beaucoup plus grande que celle de X. 


6 > Faux. La variance d’une somme de deux va. indépendantes est égale à la 
somme de leurs variances, mais le résultat n’est pas vrai en général pour deux 
variables quelconques, contrairement à ce qui se produit pour l'espérance. 


7 » Seule la pièce en métal est attirée par l’aimant et on a donc P({1}) = 1 et 
P({2,3}) = 0. Par ailleurs : 


P(X = Y) = P({w € R/X(w) = Y(w)}) = P({1}) =1 


donc ces deux applications sont égales avec une probabilité égale à 1 (événement 
certain). L'application Y est constante, avec Y-!(1) = @, donc c’est une variable 
aléatoire certaine : P(Y = 1) = 1. Cependant, on ne peut pas en conclure que la loi 
de X est la même, puisque X n’est pas une variable aléatoire et que cette notion n’a 
donc pas de sens. En effet, X-1(2) = {2} # 4, donc l'application X n’est pas une 
va. et on ne peut donc pas lui associer une loi de probabilité. 
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8 » Si on pose Z = X — Y, on peut écrire X = Y + Z et la relation proposée s'écrit 
alors V(Z) = V(X) — V(Y), ce qui est la même chose que V(X) = V(Y)+V(Z). Cette 
relation sera donc vérifiée en particulier si les variables Y et Z sont indépendantes. Il 
ne faut surtout pas lire cette relation sous la forme « variance d’une différence égale 
à la différence des variances » car c’est simplement un jeu d'écriture consistant à 
écrire sous une autre forme la relation (qui elle est vraie) « variance d’une somme 
de deux va. indépendantes égale à la somme des variances ». 


9 > La va. X suit une loibinômiale 8 (n, p), la probabilité que le candidat connaisse 
une réponse tirée étant p et les tirages étant indépendants, puisque avec remise. 
On en déduit comme résultat du cours que V(X) = np (1 — p). De même, puisqu'il 
y a une probabilité 1 — p que le candidat ne connaisse pas une réponse, la va. Y 
suit une loi binômiale 8 (n,1 — p) et on a aussi V(Y) = np (1 — p). Bien entendu 
on a toujours X + Y = n, la somme de ces deux variables n'étant pas aléatoire, avec 
donc V(X + Y) = 0. La somme des variances n’est pas égale à la variance de la 
somme de ces deux v.a. qui ne sont pas indépendantes, leur somme étant d’ailleurs 
constante, donc de variance nulle. 


10 >1a composition initiale de l’urne est {B,N,N} et selon que la première 
boule tirée sera B ou N, les compositions respectives avant le second tirage seront 
{N,N,N} ou {B,B,N}. Dans le premier cas, seul le résultat (BN) est possible, alors 
que dans le second cas on peut avoir (NB) ou (NN). Ceci correspond donc à 
l'ensemble fondamental = {(BN), (NB), (NN)}. Les tirages sont bien sûr dépen- 
dants ici puisque la composition de l’urne dépend du tirage précédent. Pour le 
calcul des probabilités des événements élémentaires, nous allons noter B; (resp. 
Ni) l'événement « avoir tiré une boule blanche (resp. noire) au i-ème tirage », avec 


1 1 

i = 1 ou 2. On obtient alors aisément P(BN) = P(B:)P(N:|B1) = 3 x 1 — 3’ 
2 2 4 2 À, 2 

P (NB) = P(N:) P (B2|N1) = 3 x + et P (NN) = P(N:) P (NN) = 3 x 0 


L'ensemble fondamental nous indique que X ne peut prendre comme valeurs que 
1 ou 2, avec X-1(1) = {(BN), (NB)} et X_1 (2) = {(NN)} et par conséquent : 


P(X = 1) = P(BN) + P(NE) =: 
P(X = 2) = P(NN) =; 


11 » Si la boule tirée initialement est blanche, comme il n’y a que deux noires, il 
y aura au maximum trois tirages. Nous noterons B; (resp. N;) l'événement « avoir 
tiré une boule blanche (resp. noire) au i-ème tirage », avec 0 < i < 5. La loi de X, 
conditionnellement à Bo, se détermine par : 


4 10 
P(X =1]1B P(B == — 
( 1Bo) (B1) 615 
2 4 4 
P(X = 2]Bo) = P(N,B5) = - x = = — 
( 1Bo) (N1B2) SE 
2,1 À 1 
P(X = B = P B = — _ = — 
( 3|Bo) (NiN2B3) CAT 
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Notons au passage que la somme de ces probabilités conditionnelles est bien égale 
à 1. 


Si la boule tirée initialement est noire, il peut y avoir cette fois jusqu'à cinq tirages 
avant d'obtenir une noire, puisqu'il y a quatre blanches. La loi conditionnelle est 
définie par : 


2 5 
P(X=1INo) = P(N:) = 5 


PIX ANNE PON)= + 
6 5 15 
P(X = BINo) = P(BBANs) = © X EX 2 = 2e 
RAP Ne a de 
6 5 4 3 15 
RSS PP ND ee nn 
6 5 4 3 2 15 


La loi de X se déduit de la formule de la probabilité totale en décomposant 
l'événement (X = x) sur Bo et No, avec pour x € X (Q2) = {1,2,3,4,5)} : 


P(X= 2x) = P (Bo) P(X = x|Bo) + P (No) P(X = xINo) 


S. 10 1. & 6 2 4 1 4 4 
it P(X =1 = = === _ — = -,P(X=2 = = —— = = = —, 
Den ee RE CET AE TT CT. 


D À. 1 3 jf. 2 2 
PR de ris =, P(X=4) = = x = = = et P(X=5) — 


5 46 5 D 3° 15 45 
d À 


3 5% On vérifie à nouveau que la somme de ces probabilités est égale à 1. 


12 » Les valeurs possibles de X sont 2, 3 et 4, avec un gain qui sera associé 
seulement aux résultats correspondants PP, FPP et FFPP ou PFPP de probabilités 


1 ; 
respectives ta On obtient donc comme espérance de gain, en tenant 


ze 
22’ 93 
compte de la mise initiale de 100 francs : 


1 12, Î 13, 2 4-4 21 
E(G) = 33 x 2047 + 23 x 209 + 27 x 20% À — 100 = © 


13 > Si X > N, le nombre de voitures vendues est X, ce qui correspond à un gain 
pour le garagiste de valeur G = aN. Si X < N, le garagiste vendra X voitures et il 
lui en restera N — X, ce qui correspond à un gain G = 4X — b(N — X). L'expression 
de l'espérance du gain est donc définie à partir de la loi de X par: 


N-—1 
E(G)=aNP(X> N)+ ÿ [ax —b(N—x]P(X= x) 
x=0 


32 TD Statistique et probabilités 


Tous les entiers x de {0,1,...,n} ont la même probabilité, c’est-à-dire que X suit 
une loi uniforme discrète, avec P (X = x) = 1/(n + 1). On obtient donc : 


n N-1 


1 (a + b) x — bN 
E = aN ——— DR 
EI Lin n +1 
aN(n—N+1) N(N-—1)  bN? 
2” SRE TE 
nil MP a 
: N[CQn+1)a—-b-{(a+b)N] 
_ 2(n+1) 
Cette valeur est maximum quand le numérateur h (N) est maximum, avec h (N) = 
. Qn+1)a—b ne 
Q@n+1)a—b—2(a+b)N qui s’annule pour N = TOGED et une dérivée 
seconde H"' (N) = —2 (a + b) < 0. La commande optimum correspond donc bien à 


cette valeur de N. 

14 > Les probabilités p;, = P(X=i) pour i = 0,1,2 sont bien sûr liées par 

Po + Pi +p2 = 1. On donne d'autre part E(X) = p1 + 2p2 = 1. Enfin, par 
3 

E (X2) = V(X) + E2 (X) = 3 = Pi + 4p2, on déduit p2 = 1/4, pi = 1/2 et po = 1/4. 

15 » L'absence de mémoire de l'enfant se traduit par une indépendance des 

tentatives successives qui ont à chaque fois la même probabilité 1/N de réussir. Ces 


tentatives s’effectuant jusqu’à la découverte du jouet, il s’agit d’une loi géométrique 
de paramètre p = 1/N, soit pour tout entier strictement positif k : 


Éd 
P(X=Kk) = |1- — — 
( ) ( <) N 
et une espérance E (X) = N. 


Le jouet est trouvé à l'issue de n tentatives avec une probabiité qui se calcule par : 
n 1 n 1 k—1 1 ñ 
PX<n)=% PX=b=—- ll. =tsii= 
Œsns LP = 2 ( <) (1-5) 


Pour n = 3, on doit donc trouver une valeur de N telle que (1 — 1/N)° soit proche 
de 0,25, ce qui correspond à N voisin de 2,7, donc le nombre de boîtes est l’entier 
le plus proche No = 3. 


16 » L'événement X < k exprime qu’à chaque tirage on a obtenu une boule de 
l’ensemble {1,2,...,k} et, en raison de l'indépendance des tirages : 


P(X<H = (S) 


On en déduit alors par différence : 


PX=D=PX<Hh-P(X<k-1)= ($) -(+) 


pour2<k<N,avec P(X = 1) = (1/N)". 
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17 » Le plus simple est de déterminer les valeurs de Y à partir du tableau des 
valeurs possibles de X : 


La loi de X étant la loi uniforme discrète sur les entiers {1,2,3,4,5,6}, il en est de 
même de la loi de Ÿ sur les entiers {6, 10, 12}. On obtient alors aisément : 


1 28 
EG = 3 (6+10+12) = — 


il 280 56 
ASE : (36 + 100 + 144) = cl V(X) = 9 


La variable M, peut prendre aussi les valeurs 6, 10 ou 12. Pour que M, soit égale 
à 6, il faut que toutes les variables Y; aient pris la valeur 6, d’où : 


P (Ms = 6) ele -s) = (:) 
i=1 


Si M, est égale à 12, c'est que l’un des événements Y; = 12 est réalisé, le complé- 
mentaire étant tous les événements Y; < 12 sont réalisés, soit : 


nl n D n 
P(M, -=rl0a-1] -1-r as 0) =1- () 


i=1 i=1 


La probabilité du dernier événement M, = 10 pourrait se déduire des probabilités 
précédentes puisque la somme de ces valeurs doit être égale à 1, mais cette méthode 
est vivement déconseillée car elle enlève justement la possibilité de détection d’une 
erreur en faisant la somme des probabilités individuelles dont on sait qu’elle doit 
être égale à 1. On exprime donc l'événement M, = 10 qui signifie que tous les 
événements Y; < 10 sont réalisés, mais pas l'événement tous les Y; sont égaux à 6, 
soit : 


P (M, = 10) = P at < 10 fo = 6) 
i=1 i=1 


ln 10) -rfQui-o) 
i=1 


_@ÿ-Q 


18 > Les tirages étant avec remise sont indépendants et donc X suit une loi 
binômiale de paramètres n = 5 et p = 2/8 avec E(X) = np = 5/4 et V(X) = 
np (1 — p) = 15/16. 
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19 > On reconnaît le schéma de la loi hypergéométrique de paramètres N = 10, 
n =3et NA = 8, soit d'après les résultats du cours : 


P(X=0)=0, PX=D= P(X=2)=P(X=3) = 2 


2 


8 12 8 7 
avec E (X) 25 5 ct (X) Sn 10 9 


28 
75 
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Variable 
aléatoire 
continue 


(1 L'ESSENTIEL DU COURS 


On associe aux résultats d'une expérience aléatoire un ensemble de valeurs qui forment un 
(ou plusieurs) intervalle(s) réel(s). Si on peut calculer la probabilité de tous les intervalles 
qui sont inclus dans cet ensemble, l'application qui réalise ce codage se nomme variable 
aléatoire (v.a.) continue. Sa loi de probabilité est généralement définie par une densité qui 
sera la dérivée de la fonction de répartition. Le calcul des moments s'effectue à l'aide de 
cette densité par une intégration. 


1. Variable aléatoire réelle continue 


1.1 Définition 


On appelle v.a. réelle définie sur (@,.4) une application X : @ — R telle que pour 
tout intervalle 1 C R on ait: 


X-lD={weR/X(w) EE A 


Cette condition est vérifiée si pour tout réel x, on a X_! (J-co, x[) € A. 


1.2 Loi de probabilité 


Elle est déterminée par la fonction de répartition (f.r.) F, définie pour tout x réel 
par: 


F9) = Px(X < x) = P{X71(]-00,x[)} = P{w € Q/X(w) < x} 
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1.3 Propriétés de la fonction de répartition 


Elle est croissante au sens large et prend ses valeurs entre 0 et 1 : 


O<F(x) <1 avec lim F(x)=0 et lim F(x) = 1 


Elle est continue à gauche : 


lim F(x — h) = F(x) 
h—0+ 


1.4 Loi continue 


Si la fonction F est continue, on dit que X est une variable aléatoire réelle continue. 
Dans ce cas, pour tout réel x, Px(X = x) = 0, et on dit que la loi est diffuse. 


1.5 Loi absolument continue 


Dans le cas où la fonction F admet une dérivée f, celle-ci est appelée densité 
de probabilité de la va. X, de loi qualifiée d’absolument continue. La f.r. est alors 
déterminée par l'intégrale : 


F(x) = 'i | f(#) dt 


Une densité est positive et intégrable sur R, d'intégrale égale à 1 : 


+00 
f() dt =1 


—00 


La probabilité d'un intervalle s'obtient en intégrant la densité sur cet intervalle : 


Px{X e [x x) = Î FO dt 


1.6 Moments d’une v.a. absolument continue 


> Espérance mathématique 


Elle est définie par : 


+00 
E(X) = 1 xf(x) dx 


OO 


lorsque cette intégrale généralisée existe. Pour tout réel 4 : 
E(X+4)=E(X)+a et E(aX) =4E(X) 
Si X et Y sont deux v.a. qui admettent une espérance : 


E(X + Y) = E(X) + EM) 
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> Variance 
Elle est définie par : 


+00 


V(X = E[X - EX = Î [x — EP fG dx = E (X?) — E?(X) = o7(X) 


—00 
lorsque cette intégrale généralisée existe. Pour tout réel 4 : 
V(X+a)=V(X) et  V(aX) = a V(X) 
Si X et Y sont deux v.a. indépendantes admettant une variance : 


VX + Y) = VX) + VM) 


> Moments non centrés et centrés 


Le moment non centré d'ordre r € N* de X est la quantité, lorsqu'elle existe : 


+00 


x'"f (0) dx 


m0 = EX = | 
Le moment centré d'ordre r € N* de X est la quantité, lorsqu'elle existe : 
+00 


OO EX EGOT = | (ECO fc dx 


—OC0 


2. Lois usuelles continues 


2.1 Loi uniforme 


37 


Une v.a. X suit une loi uniforme si sa densité est constante sur un intervalle [a, b] : 


= — si x € [a,b] 


0 sinon 


On écrit X - U ([a, b]). Sa fonction de répartition est définie par : 


0 si X<4 
X—4 . 
F(x) = si a<x<b 
b— a 
1 si b<x 
Elle admet pour moments : 
b+a (b — ay? 
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2.2 Loi exponentielle 
La loi exponentielle de paramètre 8 > 0 est celle d’une variable positive de densité : 


0e* si 0<x 
0 si x <0 


f@ = | 
On écrit X ++ €(8). Sa fr. est nulle pour x < 0, et pour x > 0: 
F(x) = of e ‘dt = [-e"T =1-e"* 

0 


Ses moments sont : 


1 1 


2.3 Loi normale ou de Laplace-Gauss 


C'est la loi d’une variable aléatoire X à valeurs dans R, de densité : 


(x — my? 
EXP ——— 


1 
oV2T 20? 
On note X -+ N(m,o) avec E(X) = m et V(X) = o2. 


FQ) = 


Si X ++ Nm, oi) et Y > Nm, 02) sont des v.a. indépendantes, alors : 


XV N mm, lot + cà) 


2.4 Loi gamma 


Une va. X de loi gamma de paramètres p > 0 et 8 > 0 est positive, de densité : 
6P 
(x = ——e “xl si x>0 
j (p) 
La fonction gamma est définie pour tout p > 0 par : 
+00 
F(p) = Î e *#-ldx 
0 
On écrit X -+ y(p,0), de moments : 
P P 


La va. Y = 6X est de loi y(p, 1), notée y(p), de moments E(Y) = V(Y) = p. 
SiX ++ y(p,0) et Y ++ y(q,0) sont des va. indépendantes, alors X+Y -+ y(p+q,0). 
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2.5 Loi du khi-deux 


La loi du khi-deux à n degrés de liberté, notée Per est la loi y(1/2,1/2) où nest un 
entier positif. Ses moments se déduisent de ceux de la loi gamma : 


Ex) ie n et V(x) 


: : __ n/2 
Na De 


= =2n 
1/4 


Si X ++ x2 et Y - x2, sont des va. indépendantes, alors X + Y + x2.,,. 


Notons une propriété importante qui peut servir de définition de cette loi : si 
X1,...,X, sont des v.a. indépendantes et de même loi N(0, 1), alors X? +: :- + X2 
suit une loi du khi-deux à n degrés de liberté. 


2.6 Loi de Student 


Soit U une va. de loi N(0,1) et Ÿ une autre va. indépendante de loi en Le 
rapport U/4V/Y/n suit une loi de Student à n degrés de liberté, notée T,. Comme 
le numérateur U suit une loi symétrique par rapport à 0, il en est de même de T,, 


avec E(T;) = 0 pour n > 1. On obtient aussi V(T,) = pour n > 2. 


n—2 
2.7 Loi de Fisher-Snedecor 
Si U et V sont deux va. indépendantes de lois respectives x2 et x2,, alors le rapport 


(U/n) / (V/m) suit une loi de Fisher-Snedecor à n et m degrés de liberté, notée 
F(n,m). 


() POUVEZ-VOUS RÉPONDRE ? 
SE 


Vrai Faux 
1. La fr d’une loi absolument continue est strictement croissante 
sur l’ensemble des nombres réels x tels que F (x) > 0. [ CO 
2. Si une loi est symétrique par rapport à l’origine, c’est-à-dire si 
F(—x) =1-—F(x) ouf (—x) = f (x), alors son espérance est nulle. E] El 
3. Siles va. X et Y suivent des lois normales, alors X + Y suit aussi 
une loi normale. [ [mi 
4. Si une loi admet une variance, alors elle admet aussi une espé- 
rance. 0 
5. Si une va. X est telle que P(X = x) = 0 pour tout x réel, alors 
elle admet une densité. CO CO 


6. Si on définit la va. Y = g(X) à l’aide d’une fonction continue 
g, alors on peut déterminer sa loi à partir de celle de X, même sig 
n'est pas injective. C, (E 
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(# 
le QUESTIONS DE RÉFLEXION 


7. Comment déterminer si la loi de probabilité d’une v.a. réelle X est continue (ou 
diffuse), mixte ou absolument continue, connaissant sa fonction de répartition F? 


8. Si une loi est définie par une densité, indiquer comment on peut étudier 
l’existence de ses moments centrés. 


G ENTRAÎNEMENT 


Fonction de répartition 


9. Soit f la fonction définie par : 


k(—x) si 0<x<1 
0 sinon 


re =| 


Déterminer la constante k pour que f soit la densité d’une loi dont on précisera la 
fonction de répartition. 


Analyse de l'énoncé et conseils. Pour qu’une fonction soit une densité, il faut qu’elle 
soit positive et d’intégrale égale à 1. C’est cette dernière condition qui va permettre de 
calculer précisément la valeur de la constante k. On détermine ensuite la f.r. en intégrant 
la densité de —co à x, en choisissant x dans chacun des intervalles où l'expression de 
cette densité reste la même. 


Loi de Pareto 


10. Une va. X suit une loi de Pareto de densité f définie par : 


er 1 = 
f@ > Si X 7 X9 


0 sinon 


où x, est une constante positive. Déterminer la constante k pour que f soit bien une 
densité et préciser la fonction de répartition de X. 


Analyse de l'énoncé et conseils. Voir exercice précédent. 
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Loi symétrique 
11. Soit X une va. de densité : 
ax : 
—(2-x) si 0<x<2 
f@=1 4 


0 sinon 


Déterminer la f:r. de X, puis indiquer sans calculs les valeurs de P(X > 1)etE (X). 


Analyse de l'énoncé et conseils. La densité se présente sous la forme usuelle d’une 
fonction qui est non nulle seulement sur un intervalle fini, le support de la loi. La 
fr. sera donc nulle avant l’origine de cet intervalle, puisqu'il n’y a aucune masse de 
probabilité, et vaudra 1 au-delà de l'extrémité du support puisque toute la masse de 
probabilité sera située à gauche du point considéré. Si on remarque une symétrie de la 
densité par rapport au centre de l'intervalle, celui-ci sera centre de symétrie de la loi, 
c'est-à-dire sera à la fois médiane et moyenne de la loi. 


Calcul de moments 


12. Soit X une va. de densité : 


… i 0Ü0<x<0e 
— si x 

fa= 1 au 
0 sinon 


où 8 est un nombre positif donné. Déterminer la fr. F de X puis calculer E (X) et 
V(X). 


Analyse de l'énoncé et conseils. Le calcul des moments se fait par intégration, sans 
difficultés particulières dans le cas d’une densité finie sur un intervalle fini. Pour le 
calcul de la variance, il est presque toujours préférable de calculer E (X?) puis d'utiliser 
la formule développée. 

Loi de Laplace 

13. Soit X une va. de densité : 


f@ = et 


où 8 est un nombre réel donné. Calculer E (X) et V(X). 


Analyse de l'énoncé et conseils. Le principe est le même que dans l'exercice précé- 
dent mais il s’agit ici d’intégrales généralisées dont il faut examiner la convergence, 
puisqu'on intègre sur tout R. On pourra ici simplifier le calcul par la recherche d’un 
centre de symétrie de la loi. 
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Loi définie par sa f.r. 


14. Soit X une va. de fr. F définie par : 


0 si x<1 
F(x) = {nx sil<x<e 
1 si e<x 


Calculer E(X) et V(X). 


Analyse de l'énoncé et conseils. La loi est ici définie par sa f.r. dont on peut remarquer 
qu'elle est dérivable partout. Il s’agit donc d’une loi absolument continue dont on 
déterminera la densité en dérivant F et le calcul des moments s'effectuera alors comme 
dans les exercices précédents. 


Lecture de tables : loi normale 
15. a) Si X suit une loi N(35,5), calculer P(X < 25), P(37,5 < X < 40) et 
P (32,5 < X < 37,5). 


b) Calculer l'espérance et la variance d’une va. Y de loi normale, telle que 
P(Y > —3) = 0,6915 et P(Y < 2) = 0,9772. 


Analyse de l'énoncé et conseils. La table 1, page 194, fournit les probabilités asso- 
ciées à la loi normale centrée et réduite. Il faut donc dans le cas général centrer la 
variable normale, c’est-à-dire retrancher son espérance, et la réduire, c’est-à-dire la 
diviser ensuite par son écart type. Les valeurs de F(u) ne sont fournies que pour 
u > 0; la valeur de F(—u) est obtenue en prenant le complément à 1 de celle de 
F(u). Dans la seconde question, c’est à partir de la table 2, page 195, des fractiles que 
l’on devrait pouvoir déterminer les valeurs de la variable centrée-réduite associées 
aux probabilités données. Cependant ici ces probabilités figurent dans la table 1, 
ce qui permet de déterminer sans interpolation les valeurs exactes de la variable. 


Loi normale et loi du khi-deux 
16. a) Soit X une va. de loi normale telle que P (X < 2) = 0,3085 et P(X > 8) — 
0,006 2. Calculer la valeur de la probabilité P (X? — 6X < 1,84). 


b) Soit Y une va. de loi normale telle que P(Y < 2) = 0,0228 et P(Y > 3,5) = 
0,158 7. Calculer la valeur du réel 4 tel que P (= 2 a = 0,975. 


Analyse de l'énoncé et conseils. Comme dans l'exercice précédent, les probabilités 
fournies vont permettre de déterminer l'espérance et l'écart type de la loi. Il faudra 
ensuite utiliser le résultat de cours relatif à la loi du carré d’une v.a. de loi normale 
centrée-réduite. 
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Fractiles des lois de Student et de Fisher-Snedecor 
17. a) Déterminer les fractiles d'ordres 0,8 et 0,2 de la loi de Student à 12 degrés 
de liberté. 


b) Déterminer le fractile d’ordre 0,05 de la loi de Fisher-Snedecor à 30 et 10 degrés 
de liberté. 


Analyse de l'énoncé et conseils. On utilise les tables 6, page 200, et 7, page 201, des 
fractiles, en utilisant les propriétés de ces lois. 


Loi exponentielle tronquée 


18. Soit X une va. de densité : 


e-4® si x-0 
0 sinon 


re = | 


où 0 est un nombre réel donné. 
a) Déterminer la f.r. F et la médiane de cette loi. 


b) Soit X:1,...,X, des va. indépendantes et de même loi que X et posons 
Mn = min {X1,...,X,}. Déterminer la fr, puis la densité, de la va. m,. 


Analyse de l'énoncé et conseils. La médiane de la loi est le fractile d'ordre 1/2, 
c'est-à-dire la valeur Md telle que F(Md) = 1/2. Pour déterminer la loi de la plus 
petite valeur d’un échantillon, c’est-à-dire de va. indépendantes et de même loi, il 
faut exprimer l'événement (m1, > x) à l’aide d'événements associés aux variables X;, 
1<i<n.Ces événements seront indépendants, du fait de l'indépendance de ces va. 


Loi du maximum 


19. Soit X une va. de densité : 


fœ = 6-+) si —3<x<3 
+ DE — 


0 sinon 


Déterminer la fr., puis la densité, de la va. M, = max{X1,...,X,}, où X1,...,X5 
sont des v.a. indépendantes et de même loi que X. 


Analyse de l'énoncé et conseils. La f.r. de M, se détermine après avoir obtenu celle de 
X et en exprimant l'événement (M; < x) à l’aide d'événements indépendants associés 
aux variables indépendantes X:,...,X,. 
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Changement de variable 


20. Soit X une v.a. de densité : 


HOESA 
0 sinon 
où 8 est un nombre positif donné. 
Déterminer la loi de probabilité de la va. Y = —In X. 


Analyse de l'énoncé et conseils. La loi de Y est déterminée par sa fonction de 
répartition que l’on exprimera en fonction de celle de X, puis que l’on dérivera pour 
reconnaître une loi usuelle. 


Loi de Gumbel 
21. Soit X une va. de densité : 


fG@) = exp[-(x—0) -e 9] 


et X1,...,X, des va. indépendantes et de même loi que X. Déterminer la loi de 
probabilité de Y = exp — (X — 6) et en déduire celle de 5, = D, Y;, ayant posé 
Yi=exp—-(Xi—-0),1<i<n. 


Analyse de l'énoncé et conseils. La loi de Y se détermine d’abord par sa f.r. que 
l’on exprime à l’aide de celle de X. On calcule ensuite sa densité par dérivation. On 
reconnaîtra une loi usuelle, ce qui permettra d’en déduire facilement celle de 5, par 
application d’un résultat de cours. 


SOLUTIONS 
€. 


| 


1 > Faux. La densité f est une fonction positive qui peut très bien s’annuler sur 
certains intervalles où la fr. sera alors constante. Considérons par exemple la 
densité définie par : 


sinon 


Pour —2 < x < 2 la densité est nulle et F (x) = F(—2) = 1/2 reste constante. 
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2 > Faux. On peut donner comme contre-exemple la loi de Cauchy de densité 
1/x (1+ 2x?) et qui pourtant n’admet pas d'espérance. Cependant, si l'intégrale 
généralisée ET xf (x) dx existe, alors on a bien E (X) = 0. 


3 > Faux. La variable Y — —X suit une loi normale, comme X, et X + Y = 0, donc 
cette variable suit une loi de Dirac (que l’on pourrait envisager comme cas limite 
d'une loi normale d'écart type nul). Bien sûr l'énoncé devient vrai si on ajoute la 
condition d'indépendance des variables X et Y. 


4 » Vrai. L'existence d’un moment d’un certain ordre implique celle de tous les 
moments d'ordres inférieurs. 


5 > Faux. La loi est continue, la fr. est continue et strictement croissante mais pas 
forcément dérivable. On peut trouver des exemples assez complexes où la loi est 
continue mais pas absolument continue, c’est-à-dire n’admettant pas de densité. 


6 > Vrai. Prenons l'exemple de la fonction g définie par g (x) = |x|. Elle n’est pas 
injective et pourtant on peut déterminer la loi de Y = |X|. En effet, pour tout 
y > 0 l'événement Ÿ < y est équivalent à —y < X < y, dont on peut calculer la 
probabilité. Cependant, si g n’est pas injective on n’a pas la certitude de pouvoir 
toujours déterminer la loi de Y. 


7 » Si la fonction F est dérivable, on peut conclure que sa dérivée est la densité 
de la loi, qui est alors absolument continue. Sinon, on étudie la continuité de F 
sur son domaine de définition. Si elle est continue partout, la loi est continue, ou 
diffuse, c'est-à-dire qu'il n’y a aucune masse de probabilité en aucun point. Par 
contre, s’il existe au moins un point x où F est discontinue, on a alors F (xo + 0) = 
Era F(xo +h) Æ F(xo); la loi est mixte, comportant une partie continue et une 
1— 


partie discrète, car il y a au moins un point de masse non nulle : P(X = x) = 
F (xo + 0) — F (x). 

8 > L'existence d’un moment centré d'ordre entier r est équivalente à celle du 
moment non centré de même ordre, qui s'établit en étudiant la convergence de 
l'intégrale généralisée ['Ÿ x'f (x) dx. Si cette intégrale existe pour tout r, c’est que 
la loi admet des moments de tous ordres. Si on établit l'existence d’un moment 
d'ordre ro, tous les moments d'ordres inférieurs à ro existent. 


9 > L'intégrale de f sur ]-00,+oo| se réduit à : 


1 
k 
k[ A—x dx=; 


qui vaut 1 pour k = 2. 


Pour x < 0, la densité est nulle et donc F (x) = 0. Pour 0 < x < 1, on décompose 
l'intervalle d'intégration de f en deux : 


x 0 x 
F@= | HO) a= | Odt+2 | (1—t) dt = 2x — x? 
—00 co 0 


Enfin, pour x > 1 on décompose en trois intégrales qui correspondent aux trois 
intervalles où f conserve la même expression : 


x 0 TL na 
F@= | soa= f 0dt+2 | ap a+ | Odt=1 
—00 —00 0 1 
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10 » L'intégrale de f sur R se réduit à : 


+00 k 
k 1. x $ dx = nc 
x0 2x6 


qui vaut 1 pour k = 2x5. 


Pour x < xo, la densité est nulle et donc F(x) = 0. Pour x > xo, on décompose 
l'intervalle d'intégration de f en deux : 


x X0 s 2 
F@= | f® a= | 0dt+ 28 | Fdt=1- 5 
—00 = X0 


OO 


11 > Pour x < 0, la densité est nulle, donc son intégrale aussi et F (x) = 0. Pour 
0 < x < 2, le calcul de la fr. F se réduit à : 


FG= + | (1-6) dt= —-— 


Pour x > 2, on intègre la densité sur tout l'intervalle où elle est non nulle, donc 
son intégrale vaut 1 et F (x) = F (2) = 1. On peut remarquer ici que f (2 — x) = f (x) 
et cette symétrie de la densité implique la symétrie de la loi par rapport au centre 


1 
x = 1 de l'intervalle, qui est donc la médiane, avec P(X < 1) = P(X > 1) = 5’ et 


aussi la moyenne, avec E (X) = 1, puisque l'intégrale s'effectue sur un intervalle 
de longueur finie. 


12 > On obtient aisément : 
0 si x <0 
x 
FHD= 1) si 0<x<8 


1 si x > 0 


On calcule l'espérance : 


+00 2 8 à x 2 
__ = 2 ee —_ 
E@= f” xf (x) a | x a 2[5] = 59 
Puis le moment non centré d'ordre deux : 
) +00 à 2 8 5 2 x 8 e2 
EG) = f" x FO = | x a [5] -5 


e2 
TA 


Et enfin V(X) = E (X2) — E2 (X) = 
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13 > Tous les moments de cette loi existent, d’après le théorème des croissances 
comparées, en raison de la présence de l’exponentielle qui l'emporte sur toutes 
les puissances de x. Cela assure donc la convergence des intégrales [T7 x'f (x) dx 
pour tous les entiers r. Si on remarque que f (2x — 0) = f (x), on en conclut que 8 est 
centre de symétrie de cette loi, donc la médiane, mais aussi la moyenne puisque 
nous savons que celle-ci existe : E (X) = 06. Pour le calcul du moment d'ordre deux, 
il sera donc judicieux de faire le changement u = x — 4: 


pe +00 
E (X) = il ai (x) dx = | (u + He el du 


+00 +00 
= k we" du + ef e" du = 2 +6? 
0 0 


et V(X) = E(X2) — E2(X) = 2. 


14>-1 s’agit bien d’une fonction de répartition, strictement croissante de F (1) = 0 
à F (e) = 1, de dérivée nulle en dehors de l'intervalle [1,e], avec F’ (x) = f (x) = 1/x 
pour 1 < x <e. On calcule donc : 


+00 e 
Eco = af Go dx = | dx=e-1 
= 1 


OO 


+00 e 
E(&)= | x FCO dx= | xdr= 3 (e?—1) 
_ 1 


OO 


et V(X) = E(X?) F0 ( e? + 4e — 3). 


15 > a) On retranche 35 puis on divise par 5 pour pouvoir ensuite utiliser la 
table 1, page 194: 


X.— 


PX<25 =P( r 2) = 2) = 1 — D (2) = 0,0228 


où ® est la fr. de la loi N (0,1). On obtient par le même procédé : 
P(37,5 < X < 40) = ® (1) — D (0,5) = 0,1498 
et : 


P (32,5 < X < 37,5) = ® (0,5) — D (—0,5) = 2 (0,5) — 1 = 0,3830 
b) Les valeurs fournies pour les probabilités figurent dans la table 1, page 194, 


associées aux nombres 0,5 et 2. En centrant sur "m = E(Y) puis divisant par o = 
VV), les hypothèses se traduisent donc par : 


P>-D=P(—" > <) 1-8 (<) -605 
(oj © (oj 


PY<D= PT <—)-e(—")-00 
(oJ © © 
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Ce qui conduit au système : 


de solution m = —2 eto = 2. 


16 > 2) La lecture de la table 1, page 194, permet d'obtenir : 


X=n 5 
P(T< *) = 03085 = 1 0,691 5 = 1 — ® (0,5) =  (—0,5) 
© [0] 


où ® est la fr. de la loi N (0,1) et ayant posé m = E(X) et o = YV(X). De même, 
Y— - 
P ( is < —) = 0,993 8 = ® (2,5), ce qui donne les équations : 
o 


[oJ 


2—m 


8 _ 
ES ie. 
[oj 


(oj 


de solution m = 3 et o = 2. On remarque ensuite que X? — 6X = (X — 3)? —9, 
donc on doit calculer la probabilité p = P {x — 3} < 10,84}. On sait par ailleurs 
que (X — 3)° /4 suit une loi du khi-deux à un degré de liberté, donc on calcule 
p=P{(X-3)/4 <2,71} = 0,90, valeur lue dans la table 5, page 199. 


b) Avec m = E(Y) eto = /V(Y), on obtient : 


Y-m 2- s= 
PAT <T) = 1 -0972- 6 (7) =: ® (2) = D (—2) 
[0] © (oj 


et: 


P(— 2 = —") =08413=60) 
(o] 


O 
soit : 


2—m 3,5 —mMm 


=—2 et = 1 


© 


de solution m = 3 eto = 1/2. La loi de 4(X — 3)° est une loi du khi-deux à un degré 
de liberté, donc 4a est le fractile d’ordre 0,975 de cette loi, lu dans la table 5, soit 
da = 5,02 et a — 1,255. 


17 > a) La lecture de la table 6, page 200, fournit la valeur 0,873 du fractile d'ordre 
0,8. En raison de la symétrie de cette loi par rapport à l’origine, le fractile d'ordre 
0,2 est donc —0,873. 


b) La table 7, page 201, ne comporte pas le couple de degrés de liberté (30,10), 
mais le couple (10,30), qui fournit le fractile 2,16, soit P(X < 2,16) = 0,95 avec 
X - F(10,30). L’inverse de X suit une loi F(30,10), donc P(1/X > 1/2,16) = 0,95 
et le fractile d'ordre 0,05 de la loi F(30, 10) est donc 1/2,16 = 0,46. 
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18 > 2) La fr. est nulle pour x < 0. Son expression pour x > 8 est : 
x À 
Fée L e (9 dt=1-e 
0 


La médiane vérifie donc e "4-9 = 1/2, soit Md = 0 + In2. 


b) L'événement (m, > x) est équivalent à l'événement « tous les éléments de 
l'échantillon sont plus grands que x », ce qui s'écrit : 


Cm > x) = (NX > 0 
i=1 
Du fait de l'indépendance des variables X; et de leur identité de loi avec X : 
P (My > x) elfe > ) nee Eure 
i=1 i=1 
Ainsi : 
G(x) = P(m <x%)=1-P'(X>x)=1-[1-F(x]" 

soit : 


0 si x <6 
1—e 74% Si x-0 


Geo = | 


Et par dérivation : 


0 si x<0 
ne-"®-9 si x >0 


g (x) = G (x) = nf (x) [1 _ EF]! = | 


19 > Ia fr. de X est nulle pour x < —3 et vaut un pour x > 3. Si —3 < x <3,on 
obtient : 


1 f* x x 1 
Œ x]. ) 108 42 


L'événement (M, < x) est équivalent à « toutes les variables de l'échantillon sont 
inférieures à x » et comme toutes les v.a. sont indépendantes et de même loi que X, 
on obtient : 


G(x) = PM, < x) rl < s) = IIP& < x) = F"(x) 
i=1 i=1 
La densité étant : 


so = OP) 


50 TD Statistique et probabilités 


20 > Puisque 0 < X < 1, la variable Y = — In X est une variable positive dont la 
fr. est définie pour y > 0 par: 


G(Y =P(Y<y)=P(-InX<y)=P(X>e*)=1-F(e") 


Sa densité est obtenue par dérivation : 


1 
CN = CN = ef (eŸ) = eV” 


On reconnaît la loi exponentielle de paramètre 1/8. 
21 > La va. Y est positive et pour y > 0 sa fr. est définie par : 


G(y) = P(Y < y) = P{exp—(X—86) < y} = P{—-(X—86) <Iny} 
=P{X-6>-Iny} =P{X>60-—Iny} =1-F(6-Iny) 


Par dérivation, on obtient comme densité pour y > 0: 
1 = 
= PUISE 


qui est la densité d’une loi exponentielle ou loi y (1). La variable S$, est donc la 
somme de va. indépendantes qui suivent la même loi y (1) et suit donc une loi 


y (n). 
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Couple 
et vecteur 
aléatoires 


(1 L'ESSENTIEL DU COURS 


Ce chapitre généralise à plusieurs dimensions la notion de variable aléatoire. Un vecteur 
aléatoire a comme composantes des variables aléatoires réelles. Le vecteur des espérances va 
définir l'espérance de ce vecteur. La généralisation de la variance est la matrice de variances- 
covariances qui contient les variances des composantes sur la diagonale principale et les 
covariances comme autres éléments. Si toute combinaison linéaire des composantes d'un 
vecteur aléatoire suit une loi normale, alors ce vecteur suit une loi normale multidimen- 
sionnelle. 


1. Couple de v.a. discrètes 
1.1 Loi d'un couple 


Un couple de va. discrètes est constitué de deux v.a. discrètes X et Y dont les 
ensembles de valeurs possibles sont {x}ier et {y;};ey, avec 1,] € N, de loi définie 


par : 
py=P(X 2% Y = y) 


1.2 Lois marginales 


À la loi d’un couple sont associées deux lois marginales : 


PÉ=SHEeN PR Yer)=N me 


je] je] 
P(Y=y)= > P(X=xY=y) =D pp; 
iel iel 
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1.3 Lois conditionnelles 


Pour Y — 1; fixé, la loi conditionnelle de X est définie par : 


P X = x;,Y = y; Pi . 
PGC= = y) = CRE 2 PE 


1.4 Indépendance 


Les va. X et Y sont indépendantes si pour tout i € I'et tout j € ]: 


P(X Xi, Ÿ yj) P(X x;)P(Y yj) 


1.5 Moments associés à un couple 


Si h:R? — Restune application continue, elle définit une va. h (X, Y) d'espérance 
qui se calcule par : 


ÉRXNI=) SN mA) 


iel je] 


Pour H(X, Y) = [X — E(X)][Y — E(Y)], on définit le moment appelé covariance de X 
et Y : 


Cov (X, Y) = E{[X — ECOITY — EMI} = E(XY) — EE) 


On appelle coefficient de corrélation linéaire de deux v.a. X et Y le nombre réel : 


CoviX, YŸ) 


pe ÉD von 


1.6 Loi d'une somme 


La loi de probabilité de la va. Z = X + Y est définie par : 


PZ=m)=) (P(X=xY=y)/x+v%=x) 
Si X et Y sont indépendantes, on parle alors de convolution des lois de X et Y et: 


P(Z= 29 = D P(X = x)P(Y = 2x — x) 


iel 


=> P(Y=Y)P(X=x- 7) 
je] 
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2. Couple de v.a. continues 


2.1 Loi du couple 


Si X et Y sont deux v.a. continues, la loi de (X, Y) est déterminée par sa f.r. : 


Fhy=P(R ex, Y<y 


Si F est dérivable par rapport à x et y, la loi de (X, Y) admet une densité f : 


d2F(x,y) 
f (x.y) = RTE 


2.2 Lois marginales 


Les fonctions de répartition marginales de X et YŸ sont définies par : 
FxG@) = P(X < x) = F(x,+oo) et Fy(y) = P(Y < y) = F(+o0, y) 


Si la loi du couple est définie par sa densité, les densités marginales sont : 


+00 +00 
fa = | fa y dy et fr(y) = FX, y) dx 


2.3 Lois conditionnelles 


Pour une loi de densité f, les lois conditionnelles sont définies par les densités : 


ie == "00 


2.4 Indépendance 


Les va. X et Y sont dites indépendantes, si pour tous les réels x et y : 
F@Yy) = fx of (y) 


2.5 Moments associés à un couple 


53 


Si h : R2 — R est une application continue, elle définit une va. A(X,Y) dont 


l'espérance se calcule par l'intégrale double : 


E[h(X, Y)] = A h(x,y}f (x, y) dx dy 
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2.6 Régression 


La fonction : x + E(YIX = x), s'appelle fonction de régression de Y en X, avec: 


+. FO) 
00 AT) 


+00 
EUX = 0 = [fix = dy= | 


2.7 Loi d'une somme 
La loi de la va. Z = X + Y se détermine par sa f.r. G, définie par : 


G(2) = P(Z <2) = P(X+Y < 2) 


Elle peut se calculer, dans le cas où ce couple admet une densité f, par : 


G(2) = JL f(x, y) dx dy 
D 


où D = {(x,y) /x + y < z}. Dans le cas particulier où X et Y sont indépendantes : 


+00 A Z 
G(z) = Î ;l fx fr (s — x) ds dx = Î g(s) ds 


où g est la densité de Z, définie par : 


+00 +00 
un Î RCE — 2 dx = Î AG — Dfrn dy 


3. Vecteur aléatoire 


Un vecteur aléatoire X de R” est une application de @ dans R’ dont toutes les 
composantes X;, 1 < i < n, sont des v.a. réelles. On définit son espérance par le 
vecteur : 


E(X) 
E(X) = 
E(X) 
La généralisation de la variance est la matrice de variances-covariances : 


V(X) = E {[X — E(X)] ‘IX - EX} 
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Si À est une matrice de format (m=,n) et b un vecteur de R' : 
E(AX +b) = AE(X)+b et V(AX + b) = V(AX) = AV(X) 'A 
3.1 Loi multinomiale 
Le vecteur aléatoire N, de composantes N:1,...,N4, suit une loi multinomiale de 


paramètres 11, p1,...,Pk Si: 


n! n1 ñk 


PA LE ce Pr 


PINS Ne —— 
ARE 


où sr p; = 1. Si on pose ‘p = (p1,...,px), on écrit N + M(n:; p) d'espérance 
E(N) = np et de matrice de variances-covariances : 


va = nf (8) 


1<ij<k 


où ÿ est le symbole de Kronecker qui vaut 1 quand i = j et 0 sinon. 


3.2 Loi normale vectorielle 


Définition. Un vecteur aléatoire X à valeurs dans R" suit une loi normale si toute 
combinaison linéaire de ses composantes suit une loi normale dans R: 


n 
XON, = VaeR", ‘aX= ÿ_ ax; + Ni 
i=1 


La loi normale est déterminée par le vecteur espérance 1 = E(X) et la matrice 
variances-covariances 2 = V(X), la densité au point x = (x1,...,%,) étant: 


1 
foi = exp '@-WE (x) 


1 
(2x) Vdets 


Si X1,...,X, sont des va. normales indépendantes, de lois respectives N (qu, oi), 
1<i<n,alorselles constituent les composantes d’un vecteur normal X de densité: 


…: 1 1 L Xi — Mi . 
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() POUVEZ-VOUS RÉPONDRE ? 


SZ 


1. Les lois de X et Y permettent de déterminer celle du couple 
CCE 


2. L'expression E (Y|X) désigne une variable aléatoire. 


3. Deux variables aléatoires indépendantes ont une covariance 
nulle. 


4. La somme de deux lois binômiales est une loi binômiale. 


5. Si on connaît les densités des deux v.a. continues X et Y,on peut 
calculer celle de X + Y. 


6. Dans le cas multidimensionnel, l'opérateur espérance est 
linéaire. 


7. Si la densité f d’un couple (X, Y) s'écrit sous la forme f (x, y) = 
g (@ A (y), où g et h sont deux fonctions positives, alors les v.a. X et 
Y sont indépendantes. 


8. Le vecteur dont les composantes X1,...,X, sont des va. nor- 
males est un vecteur normal. 


9, Si X et Y sont deux variables aléatoires réelles normales de 
covariance nulle, elles sont indépendantes. 


4 
le QUESTIONS DE RÉFLEXION 


Vrai 


[] 


EINEI 


D —  Q 


Faux 


0] 


0 Ü 


10. Comment l'examen du tableau donnant la loi d’un couple de v.a. discrètes 
P 
permet-il de conclure facilement à la dépendance de ces deux variables ? 


11. Indiquer le moyen généralement le plus simple pour obtenir les densités 
marginales d’un couple de v.a. continues dont on connaît la fonction de répartition. 


12. Si X est une va. réelle de loi N (1,0), on lui associe la variable centrée- 
réduite U = 07! (X— 1), notamment pour pouvoir utiliser les tables. Dans le cas 
d'un vecteur aléatoire X de loi W, (1, Z), indiquer la transformation qui permet 


d'obtenir un vecteur de loi normale centrée-réduite W, (0, I). 
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G ENTRAÎNEMENT 


Variance d'une somme 


13. On lance un dé à six faces numérotées de 1 à 6et on note X la v.a. qui représente 
le chiffre obtenu. Si celui-ci est pair, la va. Y prend la valeur 1 et 0 sinon. Calculer 
la variance V(X + Y). 


Analyse de l'énoncé et conseils. La valeur de Y dépend du résultat X; donc on 
peut penser intuitivement que ces variables sont dépendantes. Pour pouvoir calculer 
la variance de la somme, il faut donc déterminer sa loi de probabilité, ce qui nécessite 
au préalable d'obtenir la loi du couple (X, Y). 


Somme de variables dépendantes 


14. Une urne contient quatre boules numérotées de 1 à 4 et l’on effectue deux 
tirages successifs sans remise, notant X (resp. Y) la va. indiquant le chiffre marqué 
sur la boule tirée au premier (resp. second) tirage. Déterminer la loi de probabilité 
de la va. X + Y. 


Analyse de l'énoncé et conseils. La loi de la somme de ces variables ne peut être 
déterminée qu'après avoir établi celle du couple, car elles ne sont pas indépendantes. 
Les tirages étant sans remise, on ne peut pas tirer deux fois le même numéro. Pour 
obtenir facilement la loi de la somme, il est conseillé de faire figurer sa valeur dans le 
tableau donnant la loi du couple. 


Loi conditionnelle discrète 


15. On jette deux dés à six faces numérotées de 1 à 6 et on note X la va. qui 
représente la somme des deux chiffres obtenus et Y la va. qui est égale au plus 
grand de ces deux chiffres. 


a) Déterminer la loi de probabilité du couple (X, Y) puis calculer E (X). Les va. X 
et Y sont-elles indépendantes ? 


b) Déterminer la loi conditionnelle de Ÿ pour X = 6, puis son espérance 
E (XX = 6). 


Analyse de l'énoncé et conseils. Les couples ordonnés (x1,x2) de résultats associés 
aux deux dés ont la même probabilité 1/36. Pour chacun d’eux il faut calculer la somme 
X1 + X2, qui donnera la valeur de X, et max {x1, 2} qui sera celle de Y, puis regrouper les 
couples de valeurs identiques ; leur nombre sera la probabilité, en 1/36-ème du couple 
obtenu. La loi conditionnelle est obtenue à partir de la colonne du tableau associée 
à X = 6, en divisant les probabilités de cette colonne par la probabilité marginale 
P(X = 6). 
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Espérance conditionnelle 


16. La loi de probabilité du couple (X, Y) est indiquée dans le tableau suivant, les 
valeurs étant exprimées en dizièmes : 


; X il 2 o : 
1 il il 2. 1 
2 0 il 1 0 
9 il 0 0 2) 


Déterminer la loi de probabilité de la va. E (Y|X), puis calculer son espérance et la 
comparer avec la valeur de E (Y). 


Analyse de l'énoncé et conseils. L'expression E (Y|X) est bien celle d’une variable 
aléatoire puisqu'il s’agit d’une fonction de X, qui est elle-même une va. Pour une 
réalisation w telle que X prend la valeur X (w) = x, cette variable prend la valeur de 
la régression en x, c'est-à-dire que E (Y|X) (w) = E(Y]|X = x). Il faut donc calculer les 
différentes valeurs de cette fonction de régression, qui seront les valeurs possibles de 
cette va. On peut ensuite calculer l'espérance de cette v.a. par rapport à la loi de X. 


Loi conditionnelle binômiale 


17. Le montant de l'indemnité versée à une entreprise qui a souscrit une police 
d'assurance incendie, après un sinistre, est une v.a. X de loi connue. Le nombre 
annuel d’incendies est une va. N qui suit une loi de Poisson de paramètre x. 
Déterminer la loi de probabilité de la va. K; qui représente le nombre annuel 
d’incendies d’un montant supérieur à une valeur x positive donnée. Déterminer 
ensuite la loi conditionnelle de N pour K, = k. 


Analyse de l'énoncé et conseils. Il faut envisager toutes les valeurs possibles n de N et 
ensuite reconnaître la loi de probabilité de K,, pour chaque valeur fixée N = n. La loi de 
K, s'obtiendra comme loi marginale du couple (K,, N). Pour obtenir la loi conditionnelle 
de N, il suffit ensuite d'appliquer la définition d'une probabilité conditionnelle. 


Couple de v.a. indépendantes 


18. Soit (X, Y) un couple de va. dont la loi est définie par la densité : 


4x(1—y) si 0<x<1, 0<y<1 


f (y) = { 


sinon 


© Dunod. La photocopie non autorisée est un délit. 


TD 4 e Couple et vecteur aléatoires 59 


a) Calculer la probabilité de l'événement (0 < X < 1/3, 0 < Y < 1/3). 


b) Déterminer les fonctions de répartition marginales des va. X et Y et établir 
qu'elles sont indépendantes. 


Analyse de l'énoncé et conseils. Pour calculer la probabilité d'un événement déter- 
miné par deux va. continues, on intègre la densité sur l’ensemble des valeurs qui 
réalisent cet événement. Les fr. marginales vont se déduire des densités marginales 
obtenues par intégration de la densité du couple par rapport à l’autre variable. Si le 
produit de ces densités est égal à la densité donnée, c’est que les variables du couple 
sont indépendantes. 


Couple de v.a. dépendantes 
19. Soit (X, Y) un couple de v.a. dont la loi est définie par la densité : 


2e-EH) si 0 < y<xX 


f(x y) = F 


sinon 


a) Calculer la probabilité de l'événement (X + Y < 1). 
b) Déterminer la fonction de répartition du couple (X, Y). 


c) Déterminer les densités marginales de X et Y. Ces variables sont-elles indépen- 
dantes? 


Analyse de l'énoncé et conseils. Pour déterminer la fr. du couple en un point 
M (x, yo), il faut intégrer la densité sur le domaine E =] — 00, xo[x] — , ol. Il faudra 
alors distinguer plusieurs cas selon la position du point M par rapport au domaine D 
où cette densité est non nulle. Ayant déterminé cette f.r., on en déduit aisément les fr. 
marginales en faisant tendre successivement 19 et x vers plus l'infini. C’est la méthode 
ici la plus simple pour obtenir ensuite les densités marginales par dérivation de ces fr. 
marginales. 


Valeurs extrêmes d'une loi uniforme 


20. Soit X1,...,X, des va. indépendantes et de même loi uniforme sur [0,1]. 
Déterminer la loi de probabilité du couple de valeurs extrêmes (m:,M,), ayant 
posé m, = min{X1,...,X,}et M, = max{X1,...,X,}. 


Analyse de l'énoncé et conseils. Il faut d’abord exprimer la f.r. du couple à l’aide de 
l'événement (My > x) N (Ma < y) qui s'écrit facilement à l’aide d'événements associés 
aux variables X1,...,X, et dont la probabilité sera facile à calculer. La densité de ce 
couple de variables continues s’en déduira alors par dérivation. 
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Fonction de régression 
21. Soit (X, Y) un couple de v.a. dont la loi est définie par la densité : 


iGi= É si (x,y) € D 


sinon 


où D est l’intérieur du triangle de sommets (—1,0),(0,1) et (1,0). Déterminer 
l'expression de la fonction de régression de Y en X. 


Analyse de l'énoncé et conseils. La fonction de régression est définie au point x par la 
valeur de l'espérance conditionnelle E (Y|X = x). La loi étant continue, cette espérance 
va se calculer après détermination de la densité conditionnelle, obtenue en divisant la 
densité du couple par la densité marginale de X. 


Loi multinomiale 


22. On effectue n tirages avec remise dans une urne qui contient une boule noire, 
deux blanches et trois vertes. Déterminer la loi de probabilité du vecteur N dont les 
composantes N:,N: et N; désignent respectivement le nombre de boules noires, 
blanches et vertes tirées. Calculer ensuite E (N) et V(N). 


Analyse de l'énoncé et conseils. Les résultats du cours permettent d'obtenir sans 
difficultés les réponses. 
Transformation linéaire d'un vecteur gaussien 


23. Si X1, X2 et X; sont trois va. indépendantes de même loi N (0,1), déterminer 
la loi de probabilité du vecteur Y dont les composantes sont définies par : 


1 il 1 
= 5 & +X2), ee re EE), Y3 = à + X2 + 2X3) 


Analyse de l'énoncé et conseils. Le vecteur Y est le transformé linéaire du vecteur 
X de composantes X1, X2 et X3. On établira facilement que X est un vecteur gaussien, 
ce qui permettra d'en déduire par application du cours qu'il en est de même de Y. 
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SOLUTIONS 
€ 


€ 


1 > Faux. Dans le cas général, la connaissance des lois marginales ne permet pas 
de déterminer la loi du couple. Par contre, dans le cas particulier où les variables 
sont indépendantes, la loi du couple s'obtient comme produit des lois marginales. 


2 » Vrai. Il s'agit d’une variable aléatoire car c’est une fonction de X, qui est une 
variable aléatoire. Pour un événement élémentaire w tel que X prend la valeur 
X (w) = x, cette va. aura comme réalisation la valeur de la fonction de régression 
au point x, c'est-à-dire E (Y|X) (w) = E (YIX = x). On peut donc calculer l'espérance 
de cette variable par rapport à la loi de X et on établit que E[E (Y|X)] = E (Y). 


3 > Vrai. Si deux va. X et Y sont indépendantes, alors E(XY) = E(X)E(Y), ce 
qui implique que Cov (X, Y) = 0. Par contre, la réciproque est fausse dans le cas 
général, c’est-à-dire que deux variables peuvent avoir une covariance nulle et être 
dépendantes. 


4 » Faux. Pour que l'énoncé devienne vrai en général, il faut ajouter la condition 
d'indépendance des deux lois. Si par exemple X suit une loi binômiale, X+ X = 2X 
ne suit pas une loi binômiale. 


5 > Faux. Ilest nécessaire, dans le cas général, de connaître la loi du couple (X, Y) 
pour pouvoir déterminer celle de X + Y, puisqu'elle implique ces deux variables 
simultanément. Cependant, si les deux variables sont indépendantes, l'énoncé 
devient vrai. 


6 »> Vrai. Cette propriété, qui était vraie en unidimensionnel, subsiste dans le cas 
multidimensionnel, c'est-à-dire que si X et Y sont deux vecteurs aléatoires à n 
composantes et À, B deux matrices de format (p,n), alors : 


E (AX + BY) = AE (X) + BE(Y) 


7 » Vrai. Cependant, g et h ne sont pas forcément les densités marginales de X et 
Y car il y a plusieurs factorisations possibles. Par contre, si ce sont des densités, ce 
sont les densités marginales. 


8 > Faux. Les composantes d’un vecteur normal sont bien des v.a. normales, mais 
la réciproque est faussse en général : des composantes normales ne constituent pas 
toujours un vecteur normal. Il faut pour cela qu’elles soient indépendantes. 


9 > Faux. Pour qu’une covariance nulle implique l’indépendance de deux va, il 
ne suffit pas qu'elles soient normales, il faut qu’elles soient les composantes d’un 
vecteur normal. 


10 > ï1 suffit de trouver dans les marges une valeur p; en ligne et une valeur Pi 
en colonne dont le produit soit différent de la valeur p;; du tableau pour conclure à 
la dépendance de ces deux variables. Par contre, pour établir l'indépendance des 
variables d’un couple, il faut effectuer tous les produits des probabilités marginales 
et retrouver les valeurs données dans le tableau. 
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11 > Connaissant les valeurs F (x, y) de la fr. du couple, en faisant tendre succes- 
sivement y et x vers plus l'infini, on obtient les f.r. marginales Fx (x) et Fy ( y). Il 
suffit alors de dériver pour obtenir les densités marginales : 


fx (x) = dé et fr (y) _ dy 


12 » Le vecteur X — H est bien sûr centré. Pour réduire, on utilise la propriété, liée 
aux matrices symétriques et définies-positives, d'existence d’une matrice symé- 
trique S telle que 5? = Xl! et que nous noterons S = Z !/2, La transformation 
Y => !/2(X — 1) est celle demandée puisque : 


VH=xz //2VREsl22$S(ES)=S5 12] 


car XS2 = 1. 


13 > La loi du couple (X, Y) s'obtient sans difficultés. Elle est indiquée dans le 
tableau suivant : 


. X 1 2 S 4 5 6 
0 1/6 0 1/6 0 1/6 0 1172 
1 0 1/6 0 1/6 0 1/6 172 
1/6 1/6 1/6 1/6 1/6 1/6 1 


On peut voir par exemple que P(X=1,Y =1) =0£P(X=1)P(Y = 1) et donc 
que les variables X et Y sont bien dépendantes. On déduit de ce tableau la loi de la 
somme : 


X+Y 1 3 5 7 
1/6 11/3 173 1/6 
Puis on calcule : 


1 1 Al 1 
D 


3 3 

et : 
1 1 1 1 59 
EX+YY == xl1+=xg ri x r x 
LE a 3 


11 
soit enfin V(X + Y) = —. Le calcul de V(X) = 35/12 et V(Y) = 1/4 confirme que 
V(X) + VO) £ V(X+ Y) et donc que X et Y ne peuvent pas être indépendantes. 
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14>1e premier chiffre x, tiré dans l’ensemble E = {1,2,3,4}, a la probabilité 1/4 
et le second y, tiré dans E — {x}, la probabilité 1/3 puisqu'il ne reste plus que trois 

1 1 il 
boules. Chaque couple (x,y) tel que x Æ y est donc de probabilité D ar 
Cela permet de construire le tableau de la loi de probabilité du couple (X, Y), où les 
valeurs numériques sont exprimées en douzièmes et où la valeur entre parenthèses 
est celle de x + y. 


: X 1 2) ) 4 
il 0(2) 1(3) 1(4) 1(5) 3 
2 1(3) 0(4) 1(5) 1(6) 3 
3 1(4) 1(5) 0(6) 1(7) 3 
4 1(5) 1(6) 1(7) 0(8) 8 
3 S) 3 3 12 
De ce tableau se déduit aisément la loi de la somme : 
ACC 3 4 5 6 7 
1/6 1/6 1/3 1/6 1/6 


15 > a) La loi de probabilité du couple (X, Y) figure dans le tableau ci-dessous, 
les probabilités étant exprimées en 1/36. La somme X = 6 est obtenue par exemple 
pour les deux résultats de dés (1,5) et (5,1) pour lesquels Y = 5, pour (2,4) et (4,2) 
avec Ÿ = 4 et pour l'unique couple (3,3) qui donne Y = 3. Le couple (X, Y) prend 
donc les valeurs (6,5), (6,4) et (6,3) avec les probabilités respectives 2/36, 2/36 et 
1/36. 


ÿ 
1 1 0 0 0 0 0 0 0 0 0 0 1 
2 0 2 1 0 () 0 0 0 0 0 0 5 
o 0 0 2 2 1 0 0 0 0 0 0 5 
+ 0 0 0 2 2 2 1 0 0 0 0 7 
5 0 0 0 0 2 2 2 2 1 0 0 9 
6 0 0 0 0 0 2 2 2 2 2 1 fl 
il 2 6) 4 5 6 6) 4 3 2 1 36 
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La dernière ligne du tableau donne la loi marginale de X. On constate qu’elle est 
symétrique par rapport à 7, donc E(X) = 7. Le produit des éléments des marges 
n'est pas toujours égal aux éléments du tableau; par exemple P(X =3,Y = 1) = 
0ZP(X=3)P(Y = 1), donc les variables X et Y ne sont pas indépendantes. 


b) En divisant la colonne X = 6 par P(X = 6) = 5/36, on obtient la loi condition- 
nelle : 


et 3 4 5 
1/5 2/5 2/5 


L’espérance de cette loi est : 


routes sde. se" 
SR LR  T 


16 > Pour les différentes valeurs possibles x de X, on calcule E(Y|X = x) et on 
obtiendra ainsi les différentes valeurs possibles de la variable aléatoire discrète 
E(YIX), avec les probabiliés associées P(X = x). Par exemple : 


1 1 
EMX=1D=;x1+5x3=2 


valeur dont la probabilité est P(X = 1) = 2/10. On construit ainsi le tableau 
donnant la loi de probabilité de la va. E (Y1X) : 


E(YI|X) 2 SP 4/3 713 
2/10 2/10 3/10 3/10 


Son espérance est donc : 


2 5. 4,4 = #7 à 
ee EE TE EC 
EORNI= LS X2+LGXS +5 *3t0*3"5 


La loi marginale de Y, obtenue en additionnant les colonnes, permet d'obtenir : 


1 1 3 9 


On remarque ainsi que E[E(Y|X)] = E(Y), résultat qui est d’ailleurs toujours 
vérifié. 
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17 » Pour tout entier k, l'événement (K, = k) peut se décomposer à l’aide des 
événements disjoints {(K; = k) N(N = n)} avec n qui peut varier de l’entier k à 
l'infini. Ceci permet d'écrire : 


P(K,; = k) = D PK = k)N(N = n)} = D_P(N= n)P(K;=kIN=n) 
n=k n=k 


Lorsque le nombre annuel d’incendies est fixé à n, chacun d'eux est d’un montant 
supérieur à x avec une probabilité connue p, = P(X > x). La loi conditionnelle de 
K,IN = nest donc une loi binômiale de paramètres n et p,. Ainsi : 


k © n—k 
n— À XPx A (1 —px 
P(K =D = Der (}r! (i-n)" "=e Gr) y, ÉRAlE 


n=k | n=k (M n D! 


— € 


k k 
x (px) (x) M (px) 
ne (rx) 2 e- Er - 


À 
ayant utilisé le résultat > = = €. L'expression de cette probabilité montre que 
j! 


K, suit une loi de Poisson de paramètre àp.. Pour K, = K fixé, la va. N ne peut 
prendre que les valeurs entières n > k, avec : 


P(N = n|Kx = k) nn P(Kk = k) — (n : ble? Gp.) 


18 > 2) Onintègre la densité f sur le domaine de R? où 0 < x < 1/3et0 < y < 1/3 
pour obtenir la probabilité demandée, soit : 


1/3 1/3 
PO<X<1/80<Y<1/9 4 | ax (1- y) dy = Z 
0 0 


b) Les densités marginales s’obtiennent par intégration de la densité du couple 
par rapport à l’autre variable. Pour 0 < x < 1, la densité de X s'obtient donc par : 


1 
860 = 4x | (1— y) dy = 2x 
0 


De la même façon, pour 0 < y <1: 


n(=4(-y fra-2(-n) 
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En intégrant ces densités, on obtient les f.r. marginales demandées : 


0 six <0 
GH=ix si 0<x<1 
1 si l<x 
et: 
() si y <0 
H(y)=1)27-ÿ si 0<y<1 
1 si l<y 


Nous pouvions remarquer que la densité de (X, Y) peut s’écrire comme produit 
de deux fonctions positives, par exemple 4x1jo1 (x) et (1 — y) Lou (y), et donc que 
les va. X et Y sont indépendantes. Cependant, les deux fonctions retenues ici ne 
sont pas les densités marginales, qui bien sûr factorisent aussi f sous la forme 
f(x, y) = g 9 h (y), ce qui confirme l'indépendance de ces deux variables. 


19 > 2) On intègre la densité f sur la partie A de R? où x + y < 1 pour obtenir : 


P(X+Y< D= [fr (x axdy=2 ff et dx dy 
À 


AND 


où D est le domaine où f est non nulle. L'ensemble À N D est le triangle rectangle 
représenté dans la figure 4.1. 


xX=1-7y 


Figure 4.1 
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On voit donc qu'il est préférable d'intégrer d’abord par rapport à x sur une 
horizontale, pour ne pas avoir à distinguer deux cas, soit : 


1/2 1-y 1/2 
PX+Y<D=2/ (/ evas)eva-2{ (eY—e”!)e Ydy 
0 y 0 
= [-e *- 2e y] =1-2e ! 
b) La fr. F du couple (X, Y) est définie au point M (xo, yo) par : 


FE (x0, yo) = P{(X < x0) N (Y < w)} = fs x,y) dx dy 


avec E =] — 0,x0[x] — c,10l. Pour x < 0 ou yo < 0, l’ensemble E n’a aucune 
partie commune avec D et par conséquent F (x0, yo) = 0. Si le point M est situé à 
l’intérieur de D, on intègre sur le domaine grisé D N E représenté sur la figure 4.2 
où on voit qu'il est préférable d'intégrer sur une horizontale, c’est-à-dire d'abord 
par rapport à x. Ainsi, pour Xo > Yo > 0 on obtient : 


yo *0 yo 
F (%0,Yo) = 2 f ({ e a) e Ÿ dy = 2 [ (ee %) ee! dy 
y 


= [-eY +2e %e YTŸ = 1— 2e 70 (1 — e #0) — e72#0 


Mi (Xo, y1) ? y=Xx 
I 
I 
I 
I 
I 


X0 [— ———— — — — D 


M(xo, yo) 


0 X0 x 
Figure 4.2 


Si on sort du domaine D par une verticale de M, l'intersection avec l’ensemble E 
défini par le point M: (xo,y1), où y1 > Xo, est la même que celle obtenue pour le 
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point situé sur la première bissectrice, qui est la frontière de D. Cela veut dire que 
l’on peut calculer la valeur de F au point Mi à partir de l'expression précédente 
qui est encore valable sur la frontière, soit : 


F (xo,y1) — F (Xo, Xo) = 1 —2e + e 20 


c) On pourrait avoir ici la tentation d'écrire f (x,y) = 2e * x eY et d'en conclure 
que les variables X et Y sont indépendantes, la densité s’écrivant comme produit 
de deux fonctions positives. Ceci est faux, car l'expression de f n’est celle-ci que sur 
le domaine D où 0 < y < x et il faudrait donc ajouter le terme 1», qui lui ne peut 
pas se factoriser. Cette impossibilité de factorisation montre donc, au contraire, 
que ces variables sont dépendantes. Nous allons le vérifier à partir de l'expression 
des densités marginales, que nous allons obtenir à partir des f.r. marginales. Pour 
y tendant vers plus l'infini, on obtient celle de X, soit pour x > 0: 


Ex (x) = E (x, +00) = 1 - 2e" +e x 
La densité marginale est donc, par dérivation : 
fx (@ = 2e * (1 — e *) 
De même, on obtient les fr. et densité marginales de Y, soit pour y > 0: 
Fy (y) =F(+00,y) =1-e* 
fr (y) =2e 7% 


Le produit de fx et f, ne redonne pas f, donc on retrouve bien le fait que X et Y ne 
sont pas indépendantes. 


20 » 1afr. du couple (m,,M,) est définie par : 
E(x,y) = P {ms < 0 N (M <y)} = P(M, < y) — P {Gms > x) N (Ms < y)} 
Les événements qui apparaissent au second membre peuvent s'exprimer facile- 


ment à l’aide des va. X1,...,X,: 


nl n 


(M < y) =((X < y) et Gin = 2) N (Ma < y) = (x < Xi < y) 


i=1 i=1 


Les va. X; étant indépendantes, il en est de même des événements qu’elles défi- 
nissent, donc : 


1 


E(x,y) =[jP < y) -]]PG<Xx < y) 


i=l 
D'autre part, toutes ces variables ont la même loi, de f.r. définie pour 0 < u < 1 par 
P(X; < u) = u, d'où: 
Fay) =y- (y 
pour 0 < x < y < 1. En dérivant deux fois par rapport à x et à y, on en déduit la 
densité du couple : 
2 


f&y)=nm-1(y-x)" 
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21 » La densité marginale de X s'obtient en intégrant la densité du couple sur D 
par rapport à y. Le triangle D, représenté dans la figure 4.3, est délimité par les 
droites y = 1+x et = 1 — x. Il est symétrique par rapport à l'axe des ordonnées 
et comme l'expression de f (x, y) est symétrique en x, la densité ç de X est une 
fonction paire, c'est-à-dire que la loi est symétrique par rapport à l’origine. Pour 
0 < x < 1, on obtient : 


+00 1—x 3 
se = ff d=3f  vay= ax 


O0 


Figure 4.3 


3 
On peut donc écrire la densité de X sous la forme g (x) = : (1 — xl}? pour |x| <1 
et la densité conditionnelle de Y|X = x s'écrit donc, pour 0 < y < 1—{x|: 


2y 


GENE TE 


L'expression de la régression est donc, pour |x| < 1: 


+00 2 


EMX=»= | yh (yIX = x) dy 


1—|x| . 2 
” Grp nl y dy = zu) 


22 » Le vecteur N suit une loi multinomiale de paramètres net p1 = 1/6,p2 = 2/6, 
ps = 3/6, soit: 


nl 2313 


"1 ins! 6" 


PIN =m,N=Mm,N3=n3) 
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les ni, 1 < i < 3, étant des entiers positifs tels que #1 + n2 + n3 = n. Le vecteur 
espérance est : 


il 
n 
E(N) = - 
(N) 6 2 
3 
et la matrice de variances-covariances : 
5 —2 —3 
VN=Z|-2 8 —6 
| _ 
—3 —6 9 


23 » Les va. X1, X2, X3 étant indépendantes et normales constituent les compo- 
santes d’un vecteur normal X, de loi W; (0, 1) et de densité : 


1 1 
Frs) = se ep 5 (ti + + x) 


Le vecteur Y se déduit de X par une application linéaire qui s'écrit Y = AX, où À 
est la matrice : 


3 3 0 
A==|-2 -2 2 
di (T5 


Toute combinaison linéaire des composantes de Y est une combinaison linéaire des 
composantes de X, qui par définition est une variable aléatoire réelle. Le vecteur 
Y est donc normal et ses caractéristiques vont se déduire de celles de X par : 


E(M = E(AX) = AE(X) =0 


9 0 3 
1 

VON = V(AX) = AV 'A=A'A= LE 0 6 2 
EE 
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$— Notions 


de convergence 


(1 L'ESSENTIEL DU COURS 


En statistique, on est amené à étudier le comportement de suites de v.a. lorsque la taille de 
l'échantillon devient infinie. Pour cela nous allons définir deux types de convergence. La 
convergence en probabilité d'une suite de v.a. (X,) vers une v.a. X signifie que ces variables 
sont d'autant plus proches de X que la valeur de n est élevée, au sens où la probabilité que 
ces variables soient éloignées de plus d'une valeur positive e tend vers zéro. La convergence 
en loi correspond à la convergence des fonctions de répartition. Ces deux convergences sont 
conservées par une application continue. La suite des moyennes de v.a. indépendantes et de 
même loi converge, en probabilité, vers la moyenne commune, et en loi, vers la loi normale, 
après avoir été centrée et réduite. Ce sont les deux théorèmes fondamentaux de la statistique 
asymptotique, connus sous les noms de loi des grands nombres et théorème central limite. 


1. Convergence en probabilité 
1.1 Inégalité de Markov 


Si X est une va. positive dont l'espérance existe, l'inégalité de Markov établit que 
pour tout x > 0: 


E(X) 


P{X > RXE(X)} < ou FRÉSNES = 


1 
"1 
1.2 Inégalité de Bienaymé-Tchebychev 


Si X est une v.a. dont la variance existe, pour tout € > 0 fixé : 


vo 


P(IX— EI > 8) < — 
€ 
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1.3 Convergence en probabilité 


On dit que la suite de va. (X,) converge en probabilité vers une va. X si, pour tout 
e > 0: 


P(IX, — X|<e) = 1 quand n — 
ou, de façon équivalente : 

P(IX, — X|>e) — 0 quand n — 
On écrit : 


Xn — X 
P 


1.4 Théorème de Slutsky 


Si f est une application réelle continue, alors : 


Xn de X — FX) 160 


1.5 Théorème 
Si f est une application de R? dans R uniformément continue et si (X,) et (Y,) sont 


deux suites de va. qui convergent en probabilité respectivement vers les va. X et 
Y, alors : 


FX Y;) # FX, Y) 


Si on applique ce théorème aux fonctions f définies respectivement par f (u,v) = 
u 
u+0,f (u,v) = uvetf(u,v) = _ de X, — XetY, — Y, on déduit respectivement: 
p p 


Li roue 


XnYn —> XY 
P 
— — — àcondition que P(Y=0)=0 


1.6 Loi des grands nombres 


Si (Xh) est une suite de v.a. mutuellement indépendantes qui admettent les mêmes 
moments d'ordres un et deux, c’est-à-dire avec pour tout entier n, E(X,) = m et 
V(Xh) = 0°, alors quand n —+ 0 : 


L 1 n 
X, = Dr m 
1= 
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2. Convergence en loi 


On dit que la suite de va. (X,), de fr. F,, converge en loi vers une va. X de f:r. F si la 
suite {F, (x)} converge vers F (x) en tout point x où F est continue. On écrit alors : 


Xn — X 
loi 


2.1 Théorème 


La convergence en probabilité d’une suite (X,) implique sa convergence en loi : 


XX — X,—X 
p loi 


2.2 Propriété 
Si (X;) et (Y,) sont deux suites de v.a. telles que pour 7 — co : 
Xn— X et Y, —a 
loi P 
où a est un nombre réel, alors : 
Xn+Yn = X+a 
loi 


XyYn — aX 
loi 


X» X . £ 0 
= > — Si 
de loi 4 


2.3 Théorème de Slutsky 
Si ç est une application réelle continue, alors : 
Xy > X —— LXn) 1e gX) 
loi loi 
2.4 Conditions suffisantes de convergence en loi 


Dans le cas discret où X, (Q) = X(Q) = {a;/ie I}: 


Viel, P(X;,=a)—P(X=a) — XX, n — oo 
O1 


Dans le cas où X, et X admettent pour densités respectives f, et f : 


VxEeR, ff — Ki X, n — 00 
O1 
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2.5 Théorème central limite 


Si (Xh) est une suite de v.a. indépendantes et de même loi, admettant des moments 
d'ordres un et deux notés m = E (X,) et o? = V(X,), alors : 


XX: — 
Va No 
(6 loi 


2.6 Limite d'une suite image 


Si la suite (X,) est telle que : 


An Ca —m) => N (0,0), n — 00 
oi 


aveca, — œeto > 0,alors sig est une application réelle dérivable, la suite (g (X;)) 
converge aussi en loi avec : 


An (SX) — gGn)] Re N(00 lg'(m)|), n— 00 


3. Convergence en moyenne d'ordre p 
3.1 Définition 


On dit que la suite de v.a. (X,) converge en moyenne d'ordre p, avec 0 < p < co, vers 
la va. X si: 


EIX, — XP — 0 quand n — 
On écrit : 


Xn — 


Mp 


Dans le cas particulier p = 2, la convergence en moyenne d'ordre 2 s'appelle 
convergence en moyenne quadratique (m.q.). En écrivant : 


E(Xn — Xÿ° = V(Xn — X) + E? (Xn — X) 


qui est la somme de deux termes positifs, on retrouve les deux conditions suffi- 
santes de convergence en probabilité (cf. exercice 7, page 76) comme conditions 
nécessaires de convergence en moyenne quadratique : 


XX = 


É XX) = 0 
m.q. 


V(X: — X) — 0 
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3.2 Propriété 


Pour toute valeur de p > 0, la convergence en moyenne d'ordre p est plus forte 
que la convergence en probabilité, au sens où : 


Xn—X — X,—xX 
Mp p 


Donc, en particulier : 


Xy—X — X,—xX 
n1.4. p 


() POUVEZ-VOUS RÉPONDRE ? 
SE 


Vrai Faux 
1. Les majorants des probabilités dans les inégalités de Markov et 
de Bienaymé-Tchebychev ont des valeurs toujours inférieures à 1. [] (a 
2. Si (X,) est une suite de va. d'espérance constante, dont la 
variance tend vers zéro, alors elle converge en probabilité vers 
cette constante. Cl CO] 
3. Si la suite (X;) converge en probabilité vers la va. X, alors les 
suites In X, et er convergent en probabilité, respectivement vers 
nXete*. [] [ 
4. Si la suite (X;) converge en loi vers le nombre réel 4, alors elle 
converge aussi en probabilité vers 4. OC CO 
5. La convergence en moyenne quadratique implique la conver- 
gence en loi. OÙ 


(# 
le QUESTIONS DE RÉFLEXION 


6. Si X est une v.a. de signe quelconque, telle que E |X|* existe pour kentier positif 
fixé, montrer que l'inégalité de Markov peut se généraliser sous la forme suivante : 


EIXI* 
gk 


P(IXI Z €) < 
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7.5Si (X,) est une suite de v.a. telle que E (X,) — a et V(X,) — 0 quand n — oo, 
alors on en déduit aisément que cette suite converge en probabilité vers 4, par 
application de l'inégalité de Bienaymé-Tchebychev. Montrer qu’en fait, on peut 
énoncer un résultat plus général que celui-ci, qui établit que E(X, — X) — O et 
V(X1 — X) — 0 sont des conditions suffisantes de convergence en probabilité de 
la suite (X,) vers la va. X. 


8. Si X suit une loi de Poisson de paramètre X, tel que À tend vers l'infini, on 
sait que (X — x) /} converge en loi vers une va. U de loi N (0,1). On peut donc 


approximer la probabilité P (X < k) par P (Y < k) où Y suit une loi N (, Vi) , pour 
tout entier k. Peut-on de la même façon approximer P (X = k) par P(Y = k)? 


9. Soit (X,) une suite de v.a. indépendantes qui suivent la même loi de Cauchy, 


1 
symétrique par rapport à l’origine, de densité f (x) = ———. Sachant que 
ymétrique par rapp rigi ité f (x) rÜ+) q 
_ 1 
Xn = . >; Xi suit aussi une loi de Cauchy, peut-on en déduire de la loi des 


grands nombres la convergence en probabilité de la suite (x) ? 


G ENTRAÎNEMENT 


B. 


Inégalité de Bienaymé-Tchebychev 


10. Soit X une va. de densité : 


1 . 

au +3) si —1<x<1 
f@ = 

0 sinon 


Déterminer un intervalle de la forme [—/,1] qui contienne X avec une probabilité 
supérieure à 0,75 puis calculer la probabilité exacte de cet intervalle. 


Analyse de l'énoncé et conseils. On transforme la condition imposée par la majoration 
d'une probabilité. L'intervalle demandé peut alors être obtenu par application de 
l'inégalité de Bienaymé-Tchebychev, ayant remarqué que la loi était symétrique par 
rapport à l’origine. 
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Inégalité de Markov 


11. Soit X1,...,X, des va. indépendantes et de même loi que la va. X de densité : 


e-%®% si x>0 
X) = 
Fe { sinon 
où 8 est un nombre réel positif donné. On définit la va. m, = min{X1,...,X}. 


Pour n tendant vers l'infini, étudier la convergence en moyenne et en probabilité 
de la suite (m,). 


Analyse de l'énoncé et conseils. La convergence en moyenne, sous-entendu d'ordre 
1, s'étudie à partir du comportement de la suite numérique E (m, — 8) car toutes les 
variables sont supérieures à 8 et on peut penser intuitivement que la plus petite d’entre 
elles va tendre vers cette valeur minimale. L'étude de la convergence en probabilité 
peut se faire directement en utilisant l'inégalité de Markov. 


Convergence en probabilité 


12. La durée d’une communication téléphonique urbaine est représentée par 
une va. D uniformément distribuée sur l'intervalle [0, f], où f est un nombre réel 
positif donné. On souhaite étudier le comportement de la plus longue durée de 
n communications, définie par M, = max{D:,...,D,}, lorsque n devient infini, 
les va. D; étant supposées indépendantes et de même loi que D. Montrer que M, 
converge en probabilité vers f. 


Analyse de l'énoncé et conseils. Pour démontrer cette convergence à partir de la 
définition, on calcule pour un € > 0 fixé la probabilité P(IM,; — t| < &), après avoir 
déterminé la fr. de M, et on montre que cette suite numérique converge vers 1. 


Convergence en moyenne quadratique 
13. Soit X1,...,X, des va. indépendantes et de même loi que la va. X de loi 


normale N (0,0), où o est un nombre réel positif donné. Montrer que la suite (T,) 
définie par : 


1 n 
Ta== 2 IXil 
= 


converge en moyenne quadratique vers une limite que l’on déterminera. 


Analyse de l'énoncé et conseils. La va. T, est la moyenne de va. indépendantes 
et de même loi à laquelle on peut appliquer la loi des grands nombres. Elle converge 
donc en probabilité vers E (|X|). Ce sera donc aussi la limite pour la convergence en 
moyenne quadratique, puisque cette dernière implique la convergence en probabilité 
vers la même limite. 
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Loi des grands nombres 
14. Soit X1,...,X, des va. indépendantes et de même loi que X, de densité : 
Da. 
PS0 
f@X 5° 


où 8 est un nombre réel positif donné. Étudier la convergence en probabilité de la 
suite de va. définie par : 


1 n 
=> > Xi 
Fi 


Analyse de l'énoncé et conseils. La variable T, étant la moyenne de v.a. indépendantes 
et de même loi, on peut lui appliquer la loi des grands nombres. 


Limite de la loi de Student 


15. Soit X1,...,X, des va. indépendantes et de même loi N (0,1). Étudier, quand 
n devient infini, la convergence en probabilité de la suite : 


1 n 
s2 = L > X 
i=1 


et en déduire la loi limite d’une v.a. qui suit une loi de Student à n degrés de liberté. 


Analyse de l'énoncé et conseils. La loi des grands nombres s'applique à la suite 
LA En utilisant ce résultat et la définition de la loi de Student on peut établir qu’elle 
converge vers la loi normale. 


Théorème central limite 


16. Soit X1,...,X, des va. indépendantes et de même loi que X, de densité : 


fG) = exp[-(x— 8) - et] 


où 6 est un nombre réel positif donné. Étudier la convergence en loi de la suite (T,) 
de va. définie par : 


1 n : . 
T; —_ de (Xi—0) 
y 
i=1 


Analyse de l'énoncé et conseils. La v.a. T, est définie comme la moyenne de variables 
indépendantes et de même loi; donc on va pouvoir lui appliquer le théorème central 
limite. 
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Variance infinie 


17. Soit (X,) une suite de va. mutuellement indépendantes dont la loi est définie 
par : 


1 
P(Xy=0)=1--— et P(X,;,=n)=P(X, ñn) = — 
n 


Étudier la convergence en probabilité, en moyenne et en moyenne quadratique de 
cette suite. Peut-on appliquer la loi des grands nombres ou le théorème central 
limite ? 


Analyse de l'énoncé et conseils. Pour étudier la convergence en probabilité, on 
pourra calculer la probabilité de l'événement |X,| < e, pour un € > 0 fixé. L'étude 
des convergences en moyenne d'ordres 1 et 2 ne présente pas de difficulté particulière. 
Pour savoir si on peut appliquer les deux théorèmes de convergence à la moyenne 
empirique, il faut bien examiner si les hypothèses des énoncés sont vérifiées. 


Limite en loi d'une suite image 


18. Soit X1,...,X, des va. indépendantes et qui suivent la même loi exponentielle 
de paramètre 0 > 0. Étudier la convergence en loi de la suite (T,) de va. définie 


par : 


Analyse de l'énoncé et conseils. La va. T, s'écrit sous la forme 1/X, et on peut 
appliquer le théorème central limite à la suite (X). La propriété relative à la suite 
image Tr =g (X1) permet alors d'obtenir sa loi limite. 


SOLUTIONS 
€ 


€ 


1 > Faux. Si on choisit À < 1 dans l'inégalité de Markov, ou & < o(X) dans 
l'inégalité de Bienaymé-Tchebychev, le majorant devient supérieur à un. L'inégalité 
est donc bien évidemment vérifiée, mais ne présente aucun intérêt. 


2 » Vrai. L’inégalité de Bienaymé-Tchebychev montre quesiE (X,) =aet V(X,) — 
0, alors pour tout & > 0, on a P(IX, — E(X,)| > €) — 0, ce qui exprime que la suite 
(X) converge en probabilité vers 4. Le résultat reste d’ailleurs vrai si on a seulement 
la condition E (X,) — a au lieu de E(X,) = 4. 
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3 > Vrai. L'écriture In X, suppose bien sûr que X, > 0; les fonctions logarithme et 
exponentielle étant continues, le résultat découle du théorème de Slutsky. 


4 > Vrai. La convergence en probabilité implique toujours la convergence en loi, la 
réciproque étant fausse en général. Cependant, dans le cas particulier où la limite 
est une constante, les deux convergences sont équivalentes. 


5 > Vrai. La convergence en moyenne quadratique implique la convergence en 
probabilité, qui à son tour implique la convergence en loi. 


6 > On adapte la seconde forme de l'inégalité de Markov en l’appliquant à |X|* : 


EIXI* 
À 


P(IXF 22.) < 
On introduit alors un nombre & > 0 tel que e* = à et on en déduit alors l'inégalité 
demandée puisque |X|* > el est équivalent à |X| > &. 


7 » Isuffit d'appliquer le résultat énoncé à la suite (Y,) définie par Y, = X, — X, 
puisque par hypothèse E (Y,) — 0 et V(Y,) — 0 et que, par ailleurs : 


Y, — 0 > X, — X 
P P 


8 > La réponse est évidemment négative, car la loi de Ÿ est continue et par 
conséquent P (Y = k) = 0 pour tout entier k. Lorsqu'une loi discrète est approxi- 
mée par une loi continue, la probabilité d’un point est alors approximée par la 
probabilité d’un intervalle qui contient ce point. Ainsi P (X < k) sera approchée 
par P(k—1/2<Y <k+1/2). 


9 > Il n’est pas possible d'appliquer ici la loi des grands nombres, puisque nous 
sommes dans le cas d’une loi qui n’admet aucun moment, même pas d'espérance. 
On a seulement ici la convergence en loi de la suite (x) vers une va. X de loi de 
Cauchy, puisque c’est la loi exacte de X,. 


10 » La densité est paire et l'espérance existe puisqu'on intègre sur l'intervalle 
fini [—1,1], donc E (X) = 0. On calcule alors la variance : 


VOO=E()= fase) dr= à _: er 

4 J_ 213 5 

La condition imposée, qui s'écrit P (IX| < 1) > 0,75, est équivalente à P (|X| > 1) < 
0,25 et l'inégalité de Bienaymé-Tchebychev permet d'obtenir pour tout ! > 0 fixé: 


V(X) 


P(IXI > D < — 


En choisisssant / tel que V(X) < 0,251, la condition sera bien vérifiée. Cela donne ici 
P > 28/15, soit ! > 1,37. Comme X prend ses valeurs dans [—1,1], c'est l'intervalle 
que l’on retient, qui est de probabilité exacte égale à 1, valeur qui est bien supérieure 
à 0,75. L'application de l'inégalité de Bienaymé-Tchebychev n’a donc pas permis 
ici de réduire l'intervalle demandé, par rapport à l’ensemble des valeurs possibles 
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pour X. Connaïissant la loi de probabilité, on peut déterminer ici la valeur exacte 
de / telle que P(—-1 < X < 1) = 0,75 et qui sera solution de l'équation : 


(1+F) 


NI 


1 
0,75 = :/ (1+3x°) dx = [+1], = 


1 


Nr 


équivalente à F + 1— 3/2 = 0, de solution / = 0,86. 


11 > Nous allons déterminer la loi de probabilité de m, pour pouvoir ensuite 
calculer son espérance. Comme il s’agit de la plus petite observation parmi n, 
il vaut mieux considérer l'événement (m, > x) qui est équivalent à la réalisation 
de tous les événements (X; > x), qui sont d’ailleurs indépendants en raison de 
l'indépendance des variables X;. Ainsi : 


P (my > x) = P [n Xs ») =[[P&>9=1-F@7 
i=1 i=1 
ayant noté F la f.r. commune des va. X;. La f.r. de la va. m, est donc définie par : 
G()=P(m <%)=1-[1-F(x] 
et sa densité par : 
g@=G@=7#f@II1-F]""! 


Il faut donc déterminer aussi la f.r. de X, qui est nulle pour x < 6, et qui a comme 
valeur pour x > 8: 


FE (x) = de bd que Fa: =1-e 6) 
0 


Par conséquent, pour x > 0: 


—n(x—8) 


g (x) = ne 


L’espérance de m, se calcule donc par : 


+09 +00 
E (Mn) — n xe "00 dx = n (x — 60 + 0) e #0) dx 
8 @ 


1 +00 +00 
= = | ue" du + of ne"®-9) qx 
0 9 


ayant posé 4 = n(x—6) dans la première intégrale que l’on calcule par une 
intégration par parties. La seconde intégrale vaut 1 (on intègre la densité) et donc : 


1 
EUmn)= +0 


On en conclut donc que : 


1 
E (Im 61) _ E(my 6) ir 0 
n 
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quand n — %, condition qui exprime que m, converge en moyenne d'ordre 1 
vers 0. On peut d’ailleurs en déduire la convergence en probabilité qui est plus 
faible. Cependant, le résultat s'obtient directement par application de l'inégalité 
de Markov à la variable positive m, — 8 = |m, — 8] : 


E (my — 0) 1 
UE 


P(Im; —01Zze) = P(m —-02%Ee) < 
€ NLE 


pour tout e > 0, condition qui se traduit par : 


Mn — 0 
P 
12 > lafr de M, est définie par : 


G(x) = P(M, < x) = Po < ») =TPDe0- F6 
i=1 i=1 
car les va. D; sont indépendantes et de même loi, de fr. F définie par F(x) = 0 
pour x <0,etpour0<x<t#: 
“ du x 
7 + 


FX) = Mr 


avec F (x) = 1 pour x > t. On peut donc calculer, pour tout & > 0 fixé, la probabilité : 


P(M,-t|<e)=P(t-e<M, <t+e) 
€ 


Credit (i =) 


sie < {(poure > f cette probabilité est égale à 1). Comme 1 —e/f < 1, cette quantité 
tend vers 1 et ceci montre donc que : 


My — t 
P 


13 > L'opérateur espérance étant linéaire et les v.a. X; de même loi : 


1 n 
ET) = = DIE (XD = E (XI) 
1=1 


Nous calculons cette valeur en faisant le changement de variable x? = 2o?u : 


à +00 ; 2 +00 2 
E (IX) = Î re 27 dx = e "du = 0) — 
oV27 J-x 927 Jo T 


La convergence en moyenne quadratique vers cette valeur, qui est l'espérance de 
T,, est équivalente à la convergence vers zéro de la variance de T, qui vaut: 


ie 1 
VD = = DV (XD = =V (IX) 
i=1 
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en raison de l'indépendance des va. X;. On obtient : 
2 2 2_ 2 2 
V (XD = E (IX) — E7 (XD = 0° — . 


car E(IXP) = E (X2) = V (X) = 02. Ainsi : 


QE 
V(Ty)={1--)—-0 
r/n 


quand ñ — co, d’où on peut conclure : 


2 
T, — 6,/ — 
m.q. T 


14 > Nous allons calculer les deux premiers moments de la va. |X| : 


+00 +00 ul 
E(IX}) | Ix|f x) dx = of xeX dx = = 
0 0 
valeur obtenue en intégrant par parties. De la même manière : 


2 Lure 2 
E(X°) = 8 k x'e =; 


et V(IXI) =1/62. La va. T, étant la moyenne des v.a. |X;| indépendantes, la loi des 
grands nombres permet d'obtenir : 


dl 


T, — 
P 


15 > La loi des grands nombres s'applique à la moyenne des v.a. X? qui converge 
vers la moyenne commune E (X?) = V(X1) = 1, soit : 


1 


Onsait par ailleurs que la v.a. Y, = n5% suitune loi du khi-deux à n degrés de liberté, 
comme somme de n carrés de va. indépendantes, de même loi normale centrée- 
réduite. Si U est une v.a. de loi N (0,1) indépendante de Y,, on sait également par 
définition de la loi de Student que la va. T, = U/VY,/n suit une loi de Student à n 
degrés de liberté. Le numérateur est indépendant de ñn et nous venons de voir que 
le terme sous le radical converge en probabilité vers 1. D'après une propriété du 
cours, le rapport se comporte donc comme le numérateur, c’est-à-dire que cette loi 
de Student converge vers la loi N (0,1), ce que l’on peut écrire sous la forme : 


Ti — N(0,1) 
loi 
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16 » La va. T, est la moyenne des va. indépendantes Y; — exp — (X; — 8), de 
même loi que la va. Y = exp — (X — 8), de f.r. définie par : 


G(y) =P(Y <y) =P{exp—(X— 8) < y} 


probabilité nulle pour y < 0etquia pour valeur, obtenue par passage au logarithme 
pour y > 0: 


G(y)=P{-(X-—0) <Iny} =P(X>6-Iny) =1-—-F(8-Iny) 


où F est la fr. de X. La densité est donc nulle pour y < 0 et a pour valeur, pour 
y > 0: 


1 —1 
g(y) = 0H) =eŸ 
qui est la densité d’une loi exponentielle ou loi y (1). D'après le cours, ses moments 
sont donc E (Y) = V(Y) = 1 et le théorème central limite permet donc d'obtenir : 


Vn (Tr — D) = N (0,1) 


17 » Pour e > 0 fixé, on obtient P(IX,| < €) = P(X, = 0) = 1 — 1/n — 1 quand 
n — c et par conséquent la suite (X,) converge en probabilité vers zéro. Pour la 
convergence en moyenne, on calcule E (|X,|) = 1etdonciln'y a pas convergence en 
moyenne d'ordre 1 vers zéro. On sait, a fortiori, qu'ilne peut pas y avoir convergence 
en moyenne quadratique. On le vérifie en calculant E (X2) = n qui devient infini 
avec n. Les variables X, ont des lois différentes, donc on ne peut pas appliquer 
le théorème central limite. Comme d'autre part les moments d'ordre 2 sont aussi 
différents, puisque V(X,) = n, on ne peut pas appliquer non plus la loi des grands 
nombres. Notons cependant que l’on peut démontrer que la suite (X,) converge 


en loi vers la loi N (0. 1/ V3). 


18 > D'après le cours, on sait que les va. X; de loi exponentielle de paramètre 0 
ont pour caractéristiques communes E (X1) = 1/8 et V(X1) = 1 /8. Le théorème 
central limite permet donc d'obtenir : 


Xy — 1/0 


1 
176 No ) 


quand n — co. La fonction $ définie par g (x) = 1/x est continue et dérivable pour 
x > 0,avecg’ (x) = —1/x2. La convergence en loi de la suite 4/7 (X, — 1/6) vers une 
loi N (0,1/0) se transmet donc par cette application à la suite /7n [g (X) —g(1/ 0)] 
qui converge vers la loi normale N(0,|g (1/ 8)| /8), ce qui donne donc comme 
résultat : 


NAT . 0) ms N (0, 0) 
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Estimation 
ponctuelle 


€ L'ESSENTIEL DU COURS 


Au phénomène étudié, nous associons maintenant un modèle statistique où la va. X 
considérée, à valeurs dans E, suit une loi de probabilité, notée P4, car elle dépend d'un 
paramètre © qui appartient à un sous-ensemble donné ©, appelé espace des paramètres, 
qui sera généralement un sous-ensemble de R, mais qui peut aussi parfois être inclus dans 
RÉ. Pour se faire une idée de la valeur inconnue du paramètre Ô qui détermine cette loi de 
probabilité, on utilise un échantillon de cette loi, c'est-à-dire un ensemble (X1,.…, Xn) de 
n va. indépendantes et qui suivent la même loi que X. À partir des valeurs observées 
%1,…, Xn On calcule ensuite une certaine valeur numérique que l'on considérera comme 
une valeur approchée de © et qu'on appellera une estimation de 9. La règle qui permettra 
d'effectuer ce calcul est un estimateur auquel on demande de posséder certaines proprié- 
tés. Il est sans biais si son espérance est égale à la valeur du paramètre et convergent s'il 
converge en probabilité vers ©, quand la taille de l'échantillon tend vers l'infini. Un esti- 
mateur optimal dans la classe des estimateurs sans biais est dit efficace. Les paramètres 
les plus fréquents sont la moyenne et la variance de la loi, qui sont respectivement estimés 
par la moyenne et la variance empiriques. Dans le cas où il n'y a pas d’estimateur évident, 
on en cherche un par la méthode du maximum de vraisemblance, qui consiste à maxi- 
miser la densité de l'échantillon, ou par la méthode des moments, qui consiste à égaler 
moment théorique et moment empirique correspondant. 


1. Définition et propriétés d'un estimateur 


Définition. Un estimateur de 8 est une application T, de FE” dans F, qui à un 
échantillon (X1,..., X1) de la loi P4 associe une variable aléatoire réelle (ou plu- 
sieurs dans le cas d’un paramètre multidimensionnel) dont on peut déterminer la 
loi de probabilité. 
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La loi de la va. T,(X1,...,X,) dépend de celle de X, et donc de 8, et chaque 
réalisation T, (x1,...,%,) Sera une estimation de 0. Un estimateur est une statistique 
particulière, en tant que fonction de l'échantillon, qui permet d'attribuer une valeur 
au paramètre 8 à estimer. On pourrait donc le définir comme une statistique à 
valeurs dans 6. Comme nous n'avons imposé ici aucune condition à l’ensemble 
F, nous allons définir une propriété, que l’on pourrait qualifier de minimale, pour 
un estimateur, c'est-à-dire de prendre ses valeurs dans le même ensemble que le 
paramètre. On dira qu'un estimateur est strict si T, (E") C @. 


1.1 Biais d'un estimateur 


Pour pouvoir considérer T, (x1,...,Xx,) comme une valeur approchée de 6, il faut 
que les valeurs prises par la va. T, ne s’écartent pas trop de la valeur, fixe, de 0. 
Comme T, est une va., on ne peut imposer une condition qu'à sa valeur moyenne, 
ce qui nous amène à définir le biais d'un estimateur comme l'écart entre sa moyenne 
et la vraie valeur du paramètre : 


bn (0) = Eo (Ta) — 0 


Définitions. Un estimateur T, de 6 est dit sans biais si pour tout 0 de © et tout entier 
positif n: 


Es (Tn) = 0 
Un estimateur T, de 8 est dit asymptotiquement sans biais si pour tout 8 de @ : 


Es (Th) — 0 quand n — co 


1.2 Convergence d'un estimateur 


Définition. Un estimateur T, est convergent si la suite de va. (T,) converge en 
probabilité vers la valeur du paramètre, c’est-à-dire pour tout 0 de @ : 


Try = PT, —-8]<es) —1, Ve-0, n— 
P 


—  Py(ITs —0| >e) —+ 0 


Théorème. Tout estimateur sans biais, ou asymptotiquement sans biais, dont la 
variance tend vers zéro, quand n tend vers l'infini, est convergent. 


1.3 Estimateur optimal 


> Qualité d'un estimateur 


La qualité d’un estimateur se mesure par l'erreur quadratique moyenne, définie pour 
tout 0 par : 


EQ(T») = Eo (Ta — 0)? = Vo(Ts) + (6) 
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Dans le cas particulier d’un estimateur sans biais, cette erreur quadratique se 
confond avec la variance de l’estimateur. Si dans l'erreur totale d'estimation on 
privilégie l'erreur structurelle, mesurée par Fe (6), on fera le choix d’un estimateur 
sans biais et l'erreur d'estimation se réduira à l'erreur statistique mesurée par 
la variance de l’estimateur. Si on se place donc dorénavant dans la classe des 
estimateurs sans biais, on pourra comparer deux estimateurs T, et T} de cette classe 
par leur variance, qui mesure alors leur dispersion par rapport au paramètre, qui 
est leur espérance commune. Nous dirons que l’estimateur T, est plus efficace que 
T,, si pour tout 0 de @ et pour une taille d’échantillon n > N: 


Vo (Th) < Va (T;) 


> Inégalité de Fréchet-Darmois-Cramer-Rao 


Définitions. On appelle vraisemblance (likelihood) de l'échantillon (X1,...,X,) la 
loi de probabilité de ce n-uple, notée L (x1,...,xn: 0), et définie par : 


ñ 
LG,...,%n5 0) = [ [PK = x:16) 
i=1 


si X est une v.a. discrète, et par : 
n 
LG. 0) = ] [fi 0) 
i=1 


si X est une va. continue de densité f (x: 0). 
La quantité d'information de Fisher est définie par : 


LoZ=E (?RE : 
n — LQ 90 


Théorème. Sous les hypothèses de Cramer-Rao, en particulier si E = X(@) est 
indépendant du paramètre à estimer 6, pour tout estimateur sans biais T, de 0, 
on a: 


Vo (Th _— BF (8) 


nn 
21,0 
La quantité Br (0) est la borne inférieure de Fréchet-Darmois-Cramer-Rao (FDCR 
en abrégé). Notons que dans les conditions d'application de ce théorème, en 
particulier si E = X (Q) est indépendant du paramètre à estimer 8, on obtient une 
expression équivalente de la quantité d’information de Fisher, qui est généralement 
plus simple à calculer : 


#InL 
l; (0) = Es ETES 


b Estimateur efficace 
Définition. Un estimateur sans biais T, est dit efficace si sa variance est égale à la 
borne inférieure de FDCR : 


1 
V5 (Th) = I, (6) 
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2. Méthodes de construction d'un estimateur 
2.1 Méthode du maximum de vraisemblance 


La vraisemblance L(x1,...,x%1: 0) représente la probabilité d'observer le n-uple 
(X1,...,%n) pour une valeur fixée de 8. Dans la situation inverse ici où on a observé 
(X1,...,%n) Sans connaître la valeur de 6, on va attribuer à 6 la valeur qui paraît 
la plus vraisemblable, compte tenu de l'observation dont on dispose, c'est-à-dire 
celle qui va lui attribuer la plus forte probabilité. On se fixe donc la règle suivante : 
à (X1,..., Xn) fixé, on considère la vraisemblance L comme une fonction de 6 et on 
attribue à 0 la valeur qui maximise cette fonction. D'où la définition suivante. 


Définition. On appelle estimateur du maximum de vraisemblance (emv) toute fonction 
8, de (x1,...,X%;) qui vérifie : 


A CPR PC AE max L (1, ,Xn 0) 


Cette définition ne renseigne en aucune façon, ni sur l'existence, ni sur l’unicité, 
d’un tel estimateur. La recherche de l’emv peut se faire directement par recherche 
du maximum de L, ou dans le cas particulier où la fonction L est deux fois dérivable 
par rapport à 0, comme solution de l'équation : 


OL 


ef) 
20 


2 


0°L : 
qui vérifie aussi FT 0. Cependant, la vraisemblance se calculant à partir d’un 
produit, on préfère remplacer ce dernier problème par le problème équivalent pour 


la log-vraisemblance : 


ainL 
=) 
90 


#2nL . 
AVE —— < ÙU. 
902 


2.2 Méthode des moments 


Dans le cas où le paramètre à estimer est 8 = Es (X), moyenne théorique de la loi, 
l’estimateur naturel est la moyenne empirique, ou moyenne de l'échantillon : 


L 1 n 
Xh —= ; 2% 
1= 


De même, pour estimer le paramètre 0 = V4 (X), variance de la loi, nous retenons 
logiquement comme estimateur la variance empirique : 
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(la variance empirique modifiée 52 est obtenue en divisant par n — 1 au lieu de n). 


Plus généralement, si l’un des moments d'ordre k € N°, non centré mx = Eo (X*) = 


mx (8), ou centré x = Ep (X — m1) = x (8), dépend de 8, nous allons chercher un 
estimateur par résolution de l'équation en 8 obtenue en égalant moment théorique 
et moment empirique correspondant, soit : 


1 2 ji # L 
Mn — à +, x? = mx(e) ou Hkn — ni > (x; eu x) — Mk (0) 


i=1 i=1 


La solution de l'équation retenue, si elle existe etest unique, sera appelée estimateur 
obtenu par la méthode des moments. 


() POUVEZ-VOUS RÉPONDRE ? 
SR 


Vrai Faux 
1. La moyenne empirique est un estimateur sans biais de la 
moyenne d’une loi. Or A 
2. Toute combinaison linéaire de deux estimateurs sans biais est 
un estimateur sans biais. CO CO 
3. La variance empirique est un estimateur sans biais de la 
variance d’une loi. El Ü 
4. Tout estimateur dont la variance tend vers zéro est convergent. Li CO] 
5. Un estimateur efficace pour un paramètre est le meilleur esti- 
mateur de celui-ci. CO 
6. On peut trouver des estimateurs sans biais d’un paramètre 0 
qui ont une variance plus petite que la quantité 1/1, (8). [] (n 
7. Chercher le maximum de la vraisemblance L est équivalent à 
chercher le maximum de la log-vraisemblance In L. Cl CO 


8. Si 6, est un emv pour un paramètre 6, alors g (0,) est un emv 
du paramètre g (8) pour toute fonction g. (In O 
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(# 
le QUESTIONS DE RÉFLEXION 


9. Indiquer pourquoi l'écart type empirique modifié S,, où : 


ue 5 (XX, 


n—1 


i=1 
ne peut pas être un estimateur sans biais de l'écart type d’une loi. 


10. À partir de deux estimateurs T1 et T> du paramètre 6, sans biais et indépen- 
dants, on construit l’estimateur T3 = al + (1 — &) T», où a € ]0,1[. Déterminer 
a, en fonction des variances V1 = V(T:) et Vs = V(T), de façon que T; soit un 
estimateur sans biais de variance minimale. Les estimateurs Ti et T peuvent-ils 
être efficaces tous les deux? 


G ENTRAÎNEMENT 


Estimation d'une proportion 


11. Pour estimer la proportion p de foyers équipés d’un micro-ordinateur, on tire 
au sort un échantillon de n foyers dans la population totale, de taille supposée 
infinie. À chaque foyer i, 1 < i < n, on associe une v.a. de Bernoulli : 


x. — 1 si le foyer i possède un micro-ordinateur 
O0 sinon 


a) Étudier les propriétés de l’estimateur naturel F, du paramètre p et vérifier que 
c'est aussi l’estimateur du maximum de vraisemblance. 


b) Soit maintenant G,, l’estimateur construit de la même façon sur un second 
échantillon de taille m, indépendant du précédent. Déterminer les coefficients 
réels a et B de façon que Prin = àF1 + BG; soit un estimateur de p sans biais et de 
variance minimum. 


Analyse de l'énoncé et conseils. Le paramètre p est une proportion dans la population 
totale, donc son estimateur naturel est la proportion observée sur l'échantillon, c'est- 
à-dire la fréquence empirique. On établira que cet estimateur est sans biais, convergent 
et efficace. L'estimateur P:4 est construit en fait sur un échantillon unique de taille 
n+m, réunissant les deux échantillons séparés. Ayant établi que la fréquence empirique 
était le meilleur estimateur sans biais d’une proportion, les valeurs de à et 6 doivent 
donc correspondre à cet estimateur construit sur la réunion des deux échantillons. 
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Loi de Poisson 


12. Lenombre d'accidents mortels par mois, à un carrefour dangereux, est une v.a. 
X qui suit une loi de Poisson de paramètre *, que l’on cherche à estimer à partir d’un 
échantillon X1,..., X, de cette loi. Étudier les propriétés de l’estimateur naturel de 
ce paramètre et vérifier que c'est aussi l’estimateur du maximum de vraisemblance. 


Analyse de l'énoncé et conseils. Le paramètre x d’une loi de Poisson est la moyenne 
de cette loi, donc l’estimateur naturel est la moyenne empirique, dont on sait a priori 
qu'il est sans biais et convergent. On établira de plus qu'il est efficace et l'expression de 
la log-vraisemblance permettra de vérifier que c’est l’emv. 


Loi conditionnelle binômiale 


13. Chaque jour ouvrable, le nombre de clients qui entrent dans un grand magasin 
est une v.a. X qui suit une loi de Poisson de paramètre x connu. Une fois entré, il y 
a une probabilité p qu'un client fasse des achats pour un montant supérieur à 1 000 
francs. Pour pouvoir estimer p on dispose d’un échantillon sur ñ jours ouvrables 
de va. Y1,...,Y, de même loi que la va. Y, qui représente le nombre journalier 
de clients ayant effectué plus de 1000 francs d’achats. Proposer un estimateur 
de p, étudier ses propriétés et donner une estimation à partir de l'observation 
DV y; = 360, sachant que À = 18. 


Analyse de l'énoncé et conseils. Il faut déterminer au préalable la loi conditionnelle 
de YIX = x, pour en déduire ensuite la loi du couple (X, Y) et enfin, celle de Y. 
L'interprétation du paramètre p pour cette loi conduit à un estimateur naturel qui 
posssède toutes les propriétés classiques. 


Emv pour une loi discrète 


14. Soit X:1,...,X, un échantillon d’une va. X à valeurs entières, de loi définie 
pour ke N par: 


k 
P(X=Rk) = ——— 
a + 67+1 


où 6 est un paramètre positif. Déterminer l’estimateur du maximum de vraisem- 
blance de 6 et étudier ses propriétés. 


Analyse de l'énoncé et conseils. On cherche le maximum de la vraisemblance 
considérée comme une fonction de 8 et on établira que l’estimateur obtenu est sans 
biais, convergent et efficace. Le calcul des moments s'effectue à partir de la somme de 
la série géométrique et de ses deux premières dérivées. 
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Loi de Pareto 


15. Soit X une v.a. qui suit une loi de Pareto de densité : 


a—1 


foO=4 * 


0 sinon 


si x>1 


où « est un paramètre inconnu. Déterminer l’estimateur du maximum de vraisem- 
blance de à construit à partir d’un échantillon X1,...,X, de cette loi et montrer 
qu'il est convergent. 


Analyse de l'énoncé et conseils. Le calcul des moments de X en fonction de a ne 
fait pas apparaître d’estimateur naturel de ce paramètre et il est donc nécessaire ici de 
recourir à une méthode de construction. L'expression obtenue de l’emv permettra de 
déduire sa convergence de la loi des grands nombres. 


Loi uniforme 


16. Soit X1,...,X, un échantillon d’une va. X qui suit une loi uniforme sur 
l'intervalle [0,8], où 8 est un paramètre positif inconnu. On demande de déterminer 
un estimateur sans biais de 6 construit à partir de l’emv et de comparer sa variance 
à la quantité 1/1, (8). 


Analyse de l'énoncé et conseils. On remarque ici que l’ensemble des valeurs possibles 
pour la variable dépend du paramètre à estimer et donc que les conditions de l'inégalité 
FDCR ne sont pas remplies. Par ailleurs, l'expression de la vraisemblance ne permet 
pas de déterminer l’emv par l'étude des dérivées et il faut donc résoudre directement 
ce problème de la recherche du maximum. 


Comparaison d'estimateurs 
17. Soit X une va. qui suit une loi normale d'espérance 8 et de variance 0(1—0) où 


6 est un paramètre inconnu tel que 0 < 0 < 1. À partir d’un échantillon X:,...,X; 
de cette loi, on construit les estimateurs : 


1 n 1 n 
Ty = ne et Sy= 2 
1= 1= 


Indiquer l’estimateur que l’on doit choisir. 


Analyse de l'énoncé et conseils. Pour effectuer cette comparaison, il faut se donner 
un critère. Ayant vérifié que ces estimateurs sont sans biais, ils peuvent être comparés 
par leurs variances, le plus efficace, donc celui qu'il faut choisir étant de variance la 
plus petite. On pourra admettre que V (X?) = 262 (1 — 62). 
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Méthode des moments 
18. Soit X une va. de densité : 


FO = s(i-à) si. 0<X<E 


0 sinon 


où 8 est un paramètre strictement positif. Déterminer par la méthode des moments 
un estimateur du paramètre 0 construit à partir d’un échantillon X:1,...,X, de cette 
loi et étudier ses propriétés. 


Analyse de l'énoncé et conseils. Pour utiliser la méthode des moments, on calcule 
l'espérance de cette loi, qui va s'exprimer en fonction du paramètre, et on écrit l'égalité 
avec la moyenne empirique. On résout ensuite cette équation par rapport à 6, la solution 
fournissant l’estimateur cherché. Avant de répondre à la question sur l'efficacité, il est 
nécessaire de bien examiner la définition de la loi de probabilité. 


SOLUTIONS 
€ 


€ 


1 > Vrai. Pour toute loi qui admet une espérance, la moyenne X, de l'échantillon 
est un estimateur sans biais de E (X). 


2 » Faux. Si S et T sont deux estimateurs sans biais d’un même paramètre, aS + BT 
ne sera aussi sans biais que si à + B = 1. 


3 > Faux. La variance empirique S? est seulement un estimateur asymptotique- 
ment sans biais de la variance d’une loi. Pour obtenir un estimateur sans biais, il 
faut diviser > };_ (X; — ) par le nombre de variables indépendantes, soit n — 1, 
et non pas par le nombre n de termes. En effet, ces variables sont liées par la relation 


Lin (Gi — X1) = 0. 


4 > Faux. Par exemple, si l’on retient comme estimateur du paramètre 0 d’une 
loi uniforme sur [0,0] la moyenne X, d’un échantillon de cette loi, on a bien 
V(Xs) = 62 /12n qui tend vers zéro, mais cet estimateur ne converge pas vers 0 
puisque E (X,) = 0/2. Pour que l'énoncé soit vrai, il faut ajouter la condition d’être 
un estimateur sans biais, ou asymptotiquement sans biais. 


5 > Faux. L'énoncé est vrai si l’on se restreint à la classe des estimateurs sans 
biais. Mais si l’on utilise comme critère général de comparaison entre estima- 
teurs l'erreur quadratique moyenne, on peut trouver un estimateur avec biais 
meilleur qu’un estimateur efficace. Par exemple, pour la loi N (0,0), l’estimateur 


1 
où = = > X? est efficace, avec EQ (0%) = V (0%) = 20*/n. Mais l’estimateur 
1 204 
biaisé T, — 3-1 X? a une erreur quadratique EQ(T,) = 5 plus petite 


que celle de 02. 
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6 > Vrai. Si les hypothèses de Cramer-Rao ne sont pas vérifiées, on peut toujours 
calculer la quantité Br (8) = 1/1, (8), mais elle n’est pas une borne inférieure pour la 
variance des estimateurs sans biais de 6. On peut donc dans certains cas trouver des 
estimateurs sans biais de variance plus petite que Br (8) (cf. exercice 16, page 92). 


7 » Vrai. La fonction In est strictement croissante ; donc maximiser L est équivalent 
à maximiser In L. 


8 > Vrai. L'image par une fonction quelconque g de l’emv d’un paramètre 8 est 
emv de l’image g (6) de ce paramètre. 


9 > On sait que S2 est un estimateur sans biais de la variance o? d’une loi, c'est- 
à-dire que E (52) = o?. Si S, était un estimateur sans biais de o, on aurait donc 
E(S;) = o. La variance de cet estimateur serait alors V(S,) = E (57) — E?(5,) = 


0? — 6? — 0, ce qui est impossible. 


10 » Il est facile de vérifier que l’estimateur T; est sans biais. Les estimateurs Ti 
et T2 étant indépendants, sa variance est : 


V3 = V(T3) = Vi + (1 — à)? Va 


Pour déterminer le minimum de cette fonction de «, on calcule sa dérivée 
V, (a) = 2aVi — 2(1 — à) V2, qui s’annule pour à = V2/(V1 + V2), avec une déri- 
vée seconde qui est positive. C’est donc la valeur qui permet d'obtenir l’estimateur 
sans biais de variance minimale V3 = V:V3/(Vi1 + Va). Si les deux estimateurs 
étaient efficaces, leurs variances seraient égales à la borne FDCR BF (0) et on aurait 
alors V3 = V1/2 = Br (0) /2. Ceci est impossible car aucun estimateur sans biais ne 
peut avoir une variance inférieure à cette borne FDCR. 


11 > 2) La fréquence théorique p est estimée par la fréquence empirique, c’est- 
à-dire la proportion dans l’échantillon de foyers possédant un micro-ordinateur, 
soit : 


L 1 n 
Ps ki= se) Xi 


On retrouve les propriétés générales de la moyenne empirique qui est un estima- 
teur sans biais de la moyenne théorique : 


: Î n 1 nl 
EF) =E(R)==)EGD==) p=p 
i=1 i=1 


et qui est convergent d’après la loi des grands nombres : 


X1 = EXD =p 
p 


Pour démontrer qu'il est également efficace pour ce paramètre, nous allons déter- 
miner la vraisemblance à partir de la densité de la loi de Bernoulli, qui peut s’écrire 


P(X= x) =p"(1-p) * avec x = 0 ou 1, soit : 


n 


L (x, ee p) = IIP& = X;) = pin x (1 - p)"E xi 


i=1 
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L'expression de la log-vraisemblance est donc : 


hr. tip= D In p + Ê _ D] n(1-—p) 
1 il 


De dérivée : 


Avec pour dérivée seconde : 


#InL 1 = 


ne D nr 


Ce qui permet de calculer la quantité d’information de Fisher : 


n— ) E(X) 
2 InL 1 > 
I (p) = E a SR LEGDE ET 
il _ 
Cp, np 


PP (1-p) Pp(l-p) 


L’estimateur a pour variance : 


ts 15 pp) 
VE) = VA) = = > VD = + 2P Fee 
1= = 
qui est égale à la borne FDCR, donc il est efficace. On peut noter au passage que la 
dérivée de la log-vraisemblance s’annule pour p = D %_, x;/n. Comme la dérivée 
seconde est toujours négative, il y a un maximum en ce point, donc l’estimateur 
précédent est l’emv. 


b) Les estimateurs F, et G,;; étant sans biais, pour que Pyym = &F1 + BG; le soit 
aussi, il faut que : 


Ë (Paire) = Gp + Bp = P 


soit la condition à + $ = 1. Les deux échantillons étant indépendants, la variance 
de cet estimateur est : 


2P(1-—p) 


VPa+m) = ŒV(F,) 2 BV(Gm) =0 un 


ll — 
ne 
n 
Pour que cette quantité soit minimale, on doit résoudre le problème de minimisa- 
tion de : 
2. g2 

œ 

& , p 

nm 
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sous la contrainte 4+$ = 1. En utilisant le multiplicateur de Lagrange *, on obtient 
comme conditions nécessaires du premier ordre le système : 


(02 
2--à1=0 
nl 
IE 
m 


d'où : 


a B_a+fp 1! 


n Om n+m N 


ayant posé N = n + m. Les conditions du second ordre montrent qu'il s’agit 
effectivement d’un minimum et l’estimateur de variance minimale est construit 
avec des coefficients proportionnels aux tailles d’échantillon : 

_ n m 

Pn+m = N°" + NC" 
Ce n’est autre que la fréquence empirique de l'échantillon global, obtenu par 
réunion des deux échantillons partiels indépendants. C’est l’estimateur efficace, 
de variance minimale : 


(1—p) 


VPu+m) — : N 


12 » On estime le paramètre À = E(X), moyenne théorique de la loi, par la 
moyenne de l'échantillon, ou moyenne empirique : 


On vérifie que cet estimateur est sans biais, d’après les propriétés de linéarité de 
l'espérance : 


: 1 n 1 n 
ElX,)= =) EX _ =D» =} 
i=1 i=1 


et qu'il est convergent, d’après la loi des grands nombres : 


Xn — À = E(X) 
P 


Il converge d’ailleurs en moyenne quadratique puisqu'il est sans biais et que sa 
variance tend vers zéro : 


L 1 n 1 n k 
V(X;) = D 400) = Dh= 0 
i=1 i=1 
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Nous allons maintenant établir qu'il est efficace en calculant la quantité d’infor- 
mation de Fisher à partir de la vraisemblance : 


sn Rai 
Lx... Xn À) = 7 —— 


D'où la log-vraisemblance : 


InL(x,...,X%n N)= "À + DE] mx ÿIn(xi!) 
i=1 i=1 


et sa dérivée première : 


Les hypothèses de Cramer-Rao étant vérifiées, on peut utiliser la dérivée seconde : 


#2InL 


Te FD 


pour calculer : 


2 
LQ=E |- 0 —— 1 


1 
nr n 
on? 7 22 E @) NX 


Son inverse est la borne FDCR, égale ici à la variance de X, qui est donc un 
estimateur efficace du paramètre à. La dérivée de In L s’annule pour x = X, et 
comme d'autre part la dérivée seconde est toujours négative, on établit ainsi qu'il 
s'agit de l'expression de l’estimateur du maximum de vraisemblance de À. 


13 » Lorsque X = x, chacun des x clients entrés effectue des achats d’un montant 
supérieur à 1000F avec une probabilité p, donc la loi de Y, conditionnellement 
à X = x, est une loi binômiale de paramètres x et p. La loi du couple (X, Y) se 
détermine donc par : 


P(X=xY=y)=P(X=0HP(Y=yX=x) Cr -n) 
GW RG-nT" 
y'(e— y)! 


pour x et y entiers tels que 0 < y < x. On obtient la loi marginale de Y par 
sommation de cette loi du couple : 


00 y oo LL NTY 
=D ptrren) = 009 pren 
X=y dx 
À Cp) e*(-r) = e ? (xp) 
y! y! 


—=e 
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Ce qui montre que Ÿ suit une loi de Poisson de paramètre àp. Les résultats 
de l'exercice précédent permettent d'affirmer que P; = Y,/X est un estimateur 
sans biais, convergent et efficace, de variance V(ÿ,) = p/nx. On obtient comme 
estimation P100 = 3,6/18 = 0,2. 


14 » La vraisemblance a pour expression : 


OÙ ia 


n 
E(Ki,::::%430) = P(X = %;) = ——.— 
n Il i i ts gy"+2 1 Xi 


et la log-vraisemblance : 


EG: 430) = DA In0— ins x In (1 +0) 
i=1 i=1 


Sa dérivée est : 


2InL 1 ru 
a  — X; + a 
902 2 2 0 


qui a comme valeur —n/x(1+ x) < 0 pour 8 = * qui correspond donc bien à un 
maximum. L'emv est par conséquent la moyenne empirique : 


. L 1 n 
0, = À# —= 2 
1= 


Nous allons d’ailleurs voir que le paramètre est ici la moyenne de la loi : 


= gk o À 8 \ 
> a+6)#t +6) > 1+6 
quantité qui se calcule à partir de la somme de la série géométrique XX" = 
1/(1— x) pour |x| < 1, et de sa dérivée 37, kxk-1 = 1/(1— x)2. La valeur de la 
somme précédente est obtenue pour x = 0/(1 + 8), soit : 


0 
E(X) = ——— x (+0) =0 
Fe C7 


Le calcul préalable de l'espérance aurait donc permis de retenir la moyenne 
empirique comme estimateur naturel, sans avoir à recourir à une méthode de 
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construction comme celle du maximum de vraisemblance. On sait que cet estima- 
teur est sans biais, convergent d’après la loi des grands nombres et de variance 
V(X)/n. Pour le calcul de la variance, nous allons utiliser la seconde dérivée de 
la somme de la série géométrique D, k(k—1)x*72 = 2/(1 — x), qui va nous 
permettre d'obtenir le moment factoriel : 


oo k—2 
E[X(X-1)]= 3 KkK-1P(X=h = FE Œ= D (TS © 5) = 202 


k=0 


ayant remplacé x par 0/(1 + 0). On en déduit ensuite : 
y P P 


V(X) = E(X?) — E°(X) = E[X(X — 1)] + E(X) — E°(X) = 8 +0 


Calculons maintenant la quantité d’information de Fisher : 


#7 InL Î FE n n n 
D @)=E (À = SNCE XD) EE = 
®) ( me) eg 4 Fe (1 + 0)? 0 1+0 6(1+6) 


La variance de l’estimateur est : 


R,  _V@ _8a+8 1 
Fe nn. lI,(6) 


et cet estimateur est donc aussi efficace. 


15 > La densité n’est définie que pour à > 1. L'espérance a pour valeur : 


—a+2 l 


+00 +00 
= | xf (x) de | @= Dai dr = (D | 
L 1 


6 —a +2 |; 
quantité qui n’est définie que pour à > 2. Si cette condition est réalisée, on obtient : 
a— 1 
a—2 
On voit ainsi que le paramètre n’a pas d'interprétation simple en terme de moment. 
On calcule donc la vraisemblance pour déterminer l'emv : 


ED 


La,...,Xn; à) = (a — 1)" [lé avec minx; > 1 
Les expressions de la log-vraisemblance et de ses dérivées sont donc : 


InL(x,...,Xn; à) =nin(a—1)-aÿ inx; 


i=1 


inL __n Si. 


da œ — 
#2InL : n 
2 (a — 1)? 
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La dérivée première s’annule pour à = 1+n/ D _,1Inx;, avec une dérivée seconde 
négative, et il s’agit donc bien d’un maximum. L’emv est donc défini par : 


ps nl 


le — 
ÿ_Inx; 
i=1 


Il est de la forme @, = 1+1/Y,, ayant posé Y; = In X; pour 1 < i < n. Pour savoir si 
on peut appliquer la loi des grands nombres à Y,, nous allons calculer l'espérance 
deY=InX: 


+00 +00 
ENXS @-D f x7% In x dx = [tai + | x dx = : 
1 1 


a—1 


On aurait pu également obtenir ce résultat à partir de la loi de Y définie par sa fr. 
G(y) = P(Y <y) = P(InX <y) = P(X <e’) = F(e’), où F désigne la fr. de X. 
Pour x > 1: 


F@= | f (@) du = @ D | u%du=1-xt 
ae 1 


avec F(x) = 0 pour x < 1. Ainsi, pour y < 0, on a G(y) = 0 et pour y > 0: 
G(y) = 1—e- "1, La va. Y est donc positive, de densité (a — 1)e-(4-1W, et on 
reconnaît une loi exponentielle de paramètre à — 1. On retrouve bien la valeur de 
l'espérance, la variance étant : 


VON) = ——— 
(KE) GT 


Par conséquent, la loi des grands nombres permet d'obtenir : 


- 1 
Y, — EM) = 
P 


a —1 


On en déduit, du théorème de Slutsky, la convergence de l’estimateur : 


dy = 1+ FSC 


1 
2 


Notons que cet estimateur aurait pu aussi être obtenu par la méthode des moments, 
appliquée à la loi de Y. En effet, l'équation : 


1 = 
er 


admet comme solution unique à = 1+1/Ÿ,. 
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16 » La densité de cette loi uniforme est 1 /9 sur l'intervalle [0,0]. L'expression de 
la vraisemblance est donc : 


1 
L(,. cr Xn; 0) _— on 
si 0 < x; < 8 pour 1 < i < n. Elle est nulle si ces conditions ne sont pas remplies, 
c'est-à-dire que L = L(8) = 0 pour 8 < max{x1,...,x,}. Au-delà de cette valeur, la 
fonction L varie comme 1/8, donc est décroissante (voir figure 6.1). Par conséquent, 
il y a un maximum en ce point, où la vraisemblance n’est pas dérivable. L'emv est 
donc: 


Ma — Max {X, …. 1 Xn} 


0 max Y; 0 


Figure 6.1 


La valeur du paramètre étant la plus grande valeur possible de la variable, on 
l'estime logiquement par la plus grande observation de l'échantillon. Pour étudier 
les propriétés de cet estimateur, il est nécessaire de déterminer sa loi de probabilité, 
par l'intermédiaire de sa fonction de répartition : 


G@x)=PM <o=rlfo =») =J[Pé<0eré 
i=1 1=1 


car les variables de l'échantillon sont indépendantes et de même fr. F. On obtient 
la densité ç en dérivant : 


g (x) = nF"-1 (x) f (x) 


où f (x) = 1/8 pour x € [0,8] et f (x) = 0 en dehors de cet intervalle. La f.r. de X est 
définie par F (x) = x sur l'intervalle [0,8]. Ainsi : 


+00 d ri n 
E(M,;) = = — dx = () 
(My) [_ xg (x) dx =n ANT ï ci 
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donc cet estimateur est seulement asymptotiquement sans biais. L'estimateur sans 
biais est : 
n+1 


Th = My 
n 


Pour calculer sa variance, nous avons besoin de : 


E(M) = | 


—00 


+00 n+1 


0 
2 _ x _ NM 
x°g (x) dx =n | ge dx = RE 


D'où on déduit : 
LL 
VMn) = E(MË) — E (M) = ————— #9 
(M) (n + 2) (n +1) 


et enfin : 
02 
V(Ts) = ——— 
n(n +2) 


L'ensemble des valeurs prises par la variable est ici E = X (Q) = [0,8], qui dépend 
du paramètre; donc pour calculer la quantité d’information de Fisher, on doit 
utiliser la première formule fournie par la définition : 


l1 (0) = E ES] 
90 
La log-vraisemblance a ici comme expression In L = —n1n0, de dérivée —n/8 pour 
M, = 8, d'où: 
nr 
la (0) = E2 


Si on compare la variance de l’estimateur sans biais T, et la quantité 1/1, (6), on 
observe que : 


0? 0? 1 


"Orne Lo 


Cependant, ce majorant n’est pas une borne inférieure pour la variance des estima- 
teurs sans biais, puisque les conditions de l'inégalité FDCR ne sont pas remplies. Il 
n'est donc pas anormal de trouver un estimateur sans biais de variance plus petite 
que cette quantité. 


17 » L'estimateur naturel du paramètre 0 — E(X) est la moyenne empirique 
Ti=Xy qui est sans biais et convergent d’après la loi des grands nombres. Par 
ailleurs, on peut remarquer que E (X?) = V(X) + E?(X) = 6, donc le paramètre 8 
s'interprète aussi comme la moyenne théorique de la loi de Y = X2. L’estimateur 
Sn = YA est la moyenne empirique de l'échantillon de cette loi; il est donc aussi 
sans biais et convergent d’après la loi des grands nombres. Ces deux estimateurs 
sans biais vont être comparés par leurs variances : 
VO) O6 vom 


V(Ts) = VX) ns 
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Pour pouvoir obtenir facilement la variance de Y = X?, on peut utiliser le fait 
que (X — 8)? /0 (1 — 8) suit une loi du khi-deux à un degré de liberté, comme carré 
d'une loi normale centrée-réduite. On en déduit : 


V(X — 6)? = E(X — 0)* — E? (X — 6}? = 262 (1 — 0)? 
car on sait par ailleurs que E (X — 6)* = 36? (1 — 6). 
On écrit enfin X2 = [(X — 8) + 8]? pour obtenir : 
V(X) = V(X — 0) +40 V(X — 0) + 40 Cov[X — 6,(X — 0)°] 
= V(X — 8)? +48 V(X) = 26 (1 — ®) 
On forme le rapport des variances : 


V(Sh) 


Rs 20 (1 +0) 


Comme ce rapport dépend du paramètre à estimer, étant de valeur supérieure 


à 1 pour 


< 0 < 1, la comparaison entre ces deux estimateurs n’est pas 


possible. 


18 > Le calcul de l'espérance donne : 


> ps x 2[x2 71° 6 
EO= 5 fx(i-fjar- sfr -5] =5 


On cherche donc à résoudre l'équation X, = 0/3, de solution immédiate 0 — 3X,, 
ce qui fournit l’estimateur de la méthode des moments T, = 3X,, qui va être sans 
biais par construction : 


Pin) Et 
et convergent d’après la loi des grands nombres : 


Ty = 3Xh — 3E(X) = 0 
P 


La question de l'efficacité ne se pose pas ici car X prend ses valeurs dans l'intervalle 
[0,8], qui dépend du paramètre de la loi; donc les conditions de l'inégalité FDCR 
ne sont pas remplies. 
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Estimation 
par intervalle 
de confiance 


(1 L'ESSENTIEL DU COURS 


Afin de juger de la précision du résultat d'un problème d'estimation, nous allons associer à 
un échantillon d'une loi inconnue un ensemble de valeurs, et non plus une valeur unique. 
Ces valeurs constituent généralement un intervalle inclus dans l'ensemble © des valeurs 
possibles pour le paramètre. La détermination de cet intervalle, dit de confiance, s'effectue 
par la donnée de la probabilité, dénommée niveau de confiance, que la vraie valeur du 
paramètre appartienne à cet intervalle. 


1. Définition et principe de construction 


Définition. Un intervalle de confiance pour le paramètre 8, de niveau de confiance 
1—ae ]0,1[, est un intervalle qui a la probabilité 1 — « de contenir la vraie valeur 
du paramètre 0. 


Pour obtenir cet intervalle, on utilise un estimateur T, dont on connaît la loi en 
fonction de 6, ce qui permet de déterminer les valeurs #1 = f (0) et f = #2 (0) telles 
que : 


Po {ti (8) < Ty <t(8)}=1- a 


Il faut ensuite inverser cet intervalle pour T, afin d'obtenir un intervalle pour 
6, dont les bornes vont dépendre de l’estimateur T,, c'est-à-dire déterminer les 
valeurs a = a (T,) et b = b(T,) telles que : 


Po {a (Ty) <80<b(T;)}}=1-a 


Aïnsi, [a (Th) ,b(T,)]estun intervalle de confiance de niveau 1—a pour le paramètre 
6. Il s'obtient en déterminant l’ensemble des valeurs de 0 pour lesquelles on a 
simultanément, pour T, fixé : 


h (0) < Th et Th < b (0) 
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Si par exemple ces deux fonctions sont croissantes, on voit sur la figure 7.1 que : 


f (0) = Th — 0 < KL” (Th) et Th £ b (0) <— 0 Z ee (Ty) 


a(Th) = EC b(Tn) = Fa 


Figure 7.1 


L'intervalle est facile à obtenir ici car les fonctions #1 et # sont inversibles : 
H(G)<T<b(O) = a(M)=t) (Ti) <0< 4H" (Tr) = b(Tr) 


Le risque total « = P5 (Ty < t1) + Po (Ta > f2) peut être a priori réparti de multiples 
façons. Posons 1 = P4{0 > b(T,)} et > — P,{0 <a(T;)}; les différents choix 
possibles sont les suivants. 


> Intervalle bilatéral (a1a> > 0) 
e Symétrique : 1 = a = a/2 


C'est le choix que l’on fait si la loi de T, est symétrique, ou si on n’a aucune 
information particulière, ce choix étant le moins arbitraire. 


e Dissymétrique : &1 2 


Seules des raisons très particulières peuvent permettre de fixer les valeurs de o et 
o telles que &1 + a = a. 


> Intervalle unilatéral (œ102 = 0) 
e À droite : 1 = 0, = & 


C'est l'interprétation donnée au paramètre 0 qui conduit à un intervalle de la forme 
0 > a(T;). 


e À gauche : & = à, 4) = 0 


L'interprétation du paramètre 8 peut également conduire à un intervalle de la 
forme 8 < b(T,). 
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2. Intervalle pour une proportion 


Soit (X1,...,X,) un échantillon d’une va. X qui suit une loi de Bernoulli de para- 
mètre p, estimé par ÿ; = X,. On utilise la loi exacte de nn = Sh pour déterminer 
les solutions H = H(p) et t = t(p) des inéquations P (np, < nh) < a/2 et 
P (np, > nh) < a/2. On trace le graphe de ces deux fonctions de p. Pour une 
valeur observée ?,, l'intersection de l’horizontale correspondante avec ces deux 
courbes permet de lire sur l’axe des abscisses l'intervalle des valeurs de p pour 
lesquelles on a simultanément # (p) < P, et (p) > P, (voir figure 7.2). Ainsi, 
l'intervalle de confiance s'obtient par simple lecture de l’abaque. 


0 intervalle pour p 1 p 


Figure 7.2 


Si on ne dispose pas d’abaque, on utilise la loi asymptotique de p,. On retient alors 
un intervalle symétrique, à partir de la valeur de a lue dans la table 2, page 203, de 
la loi normale, telle que : 


On fait une seconde approximation en remplaçant p par P, dans les bornes de 
l'intervalle, ce qui conduit à l'intervalle de confiance pour p : 


Pn 1 — Ph = Pn 1 — Dh 
Pan — a BOB) pra ee 


où a est le fractile d'ordre 1 — a/2 de la loi N (0,1). Cette approximation est 
acceptable pour np(1—p) > 3. On peut également remplacer p(1—p) par sa 
borne supérieure 1/4, et obtenir ainsi l'intervalle approché le plus grand : 


_— a _ a 
— — + — 
Pn 2/n + P < Pn 2,/n 
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3. Intervalles associés aux paramètres de la loi normale 


On dispose d'un échantillon (X1,...,X,) d’une va. X qui suit une loi N (m,0). 


3.1 Intervalle pour la moyenne d'une loi normale d'écart type 
connu 


La moyenne empirique X, est un estimateur de m dont on connaît la loi de probabi- 
lité, qui est la loi normale N (m,0/,/n). L'intervalle de confiance pour le paramètre 
m est déterminé à partir de la valeur de sa probabilité : 1-0 = P{—b < X, — m < a}. 


La loi de la va. X, — m étant symétrique, on choisit b = 4, qui doit vérifier la 


condition : 
1 P a X,-m a 
— = — —— — 
: o/Vn  o/Vn  o/Vn 


L'intervalle de confiance, de niveau 1 — à, pour le paramètre m est donc : 


_ [oi = (ol 
sie FRA 

où u est le fractile d'ordre 1 — x/2 de la loi normale standard, soit u — 
dl (1— «/2),% étant la fr. de la loi N (0,1). 


3.2 Intervalle pour la moyenne d'une loi normale d'écart type 
inconnu 


La statistique utilisée dans la situation précédente était la variable normale centrée- 
réduite : 


Xn M = Xn = m 
CONTES o 


Le paramètre o étant inconnu va être remplacé par un estimateur, basé sur l’esti- 
mateur sans biais de o? : 


= 


1 n L 
n a (x . +) 
i=1 


n—1 _ 


On utilise donc comme nouvelle statistique : 
Ne X,—m 
n 
Sn 


de loi de Student à n — 1 degrés de liberté. Par lecture de la table 6, page 200, on 
détermine la valeur de f telle que : 


XX: = 
P|\-t< /n— il <t|=1-a 
Sn 
La valeur de f est le fractile d'ordre 1 — «/2 de la loi de Student T,_:, ce qui fournit 
l'intervalle de confiance pour " de niveau 1 — a: 

S 


L S _ 
PRE em <R +12) = 1-0 
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3.3 Intervalle pour la variance d'une loi normale d'espérance 
connue 


L’estimateur sans biais de o?, basé sur l'échantillon (X1,..., X,) de cette loi N (m,0) 
où m est connu est : 


L 1 n 
5? — on 
= 


de loi connue : n62/0? -+ x£. On peut donc déterminer les valeurs de a et b telles 
que : 


5? 
P(a<nêt <b)=1-0 
[os 
Ce qui conduit à l'intervalle de confiance défini par : 
2 2 
P(nSE < 0? sn) =1-a 
b a 


Cependant, il n’y a qu'une seule condition pour déterminer les deux valeurs a et b 
et il reste un degré d'incertitude puisque la loi utilisée n’est pas symétrique. Si on 
pose & = P(x% <a) et = P(x2 > b), la seule contrainte dans le choix de a et 
O2 est y + Op = 0. 


3.4 Intervalle pour la variance d'une loi normale d'espérance 
inconnue 


Quand le second paramètre m de la loi normale est inconnu, l’estimateur sans biais 
de 0? qu'il faut retenir est : 


1 n ss. 
= D 


Sa loi est connue, (n — 1) S? Jo? = NT et on peut déterminer les valeurs de 4 et b 
telles que : 


S2 
Pla<u-D® <i] =1-0 
© 
Ce qui permet d’en déduire l'intervalle de confiance défini par : 
2 2 
Pln-n% < o? < un) =1l-a 


Là encore, il n’y a qu'une seule contrainte pour déterminer les valeurs de 4 et b. Si 
nous posons a = P(x2_, <a) et = P(x2_, > b), la contrainte est 1 + a = a. 
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() POUVEZ-VOUS RÉPONDRE ? 
EE —————— 


Vrai Faux 


1. On peut toujours trouver un intervalle de confiance qui contient 
le paramètre avec une probabilité égale à 1. 0] (n 


2. À un estimateur donné du paramètre, de loi connue, on peut 
associer une infinité d’intervalles de confiance de même niveau de 
confiance donné. Q LE 


3: 1à fréquence empirique f, permet de construire un intervalle 
de confiance pour le paramètre d’une loi de Bernoulli, de niveau 
exact 1 — a, avec 0 < à < 1. [] [ 


4. C'est pour une proportion p voisine de 50% que l'estimation 
de ce paramètre est la plus imprécise. OO D 


5. Pour un niveau de confiance donné, l'intervalle pour la 
moyenne d’une loi normale d'écart type connu est de longueur 
minimale si on le choisit symétrique. (n (a 


6. Pour un niveau de confiance donné et une taille d’échantillon 
donnée, la longueur d’un intervalle bilatéral symétrique est fixée. [] (n 


7. Un intervalle de confiance pour une moyenne a une longueur 
fixe pour un niveau donné et une taille d’échantillon n donnée, 
cette longueur tendant vers zéro avec 1/n. EE EI 


4 
le QUESTIONS DE RÉFLEXION 
dE 


8. Sur un échantillon de 100 objets prélevés dans un lot de fabrication, on n’a 
observé aucun défectueux. La proportion p de défectueux admet donc comme 
estimation P100 — 0. Peut-on retenir, avec l’approximation normale, l'intervalle de 
confiance de niveau 0,95 qui se réduit à la valeur 0 ou l'intervalle approché le plus 
grand qui est —0,10 < p < 0,10? 


9. Une société de vente par correspondance désire établir le profil de sa clientèle et 
extrait par tirage sans remise cent dossiers de son fichier clients. Malheureusement 
vingt d’entre eux s'avèrent inexploitables. Indiquer comment à partir d’un inter- 
valle de confiance on peut déterminer le nombre minimum de dossiers à extraire 
pour qu'il y en ait au moins mille d’exploitables avec une probabilité de 0,95. 


10. Le chiffre d’affaires moyen d'un commerçant, calculé sur les trente derniers 
y 
jours, est de 2000 francs, avec un écart type empirique de valeur 535 = 300 francs. 
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Si on admet que son chiffre d’affaires quotidien peut être représenté par une va. X 
de loi normale, d'espérance m et d'écart type o inconnus, donner un intervalle de 
confiance de niveau 0,95 pour le paramètre m. Obtient-on le même intervalle si o 
est connu, de valeur o = 300? 


11. Un sondage effectué auprès de 1 000 personnes, réparties en cinq groupes de 
200 personnes, a donné comme valeur moyenne de dépenses mensuelles consa- 
crées aux loisirs 301 F. N'ayant relevé que la dispersion empirique des moyennes 
empiriques de chacun des cinq groupes, soit l'écart type empirique 55 = 15,51, 
construire un intervalle de confiance de niveau 0,95 pour cette dépense de loisirs. 
Comment expliquer l'amplitude de l'intervalle alors que l'enquête porte sur 1 000 
individus ? 


(1 ENTRAÎNEMENT 


=. 


Intervalles pour une proportion 


12. Sur 100 personnes interrogées, 51 déclarent qu’elles voteront pour le can- 
didat D. Magog aux prochaines élections présidentielles. Donner un intervalle 
de confiance de niveau 0,95 pour la proportion p d’intentions de vote pour ce 
candidat, dans la population. Même question si ce sondage a été effectué auprès 
d’un échantillon de 1 000 personnes. Combien aurait-il fallu interroger d’électeurs 
pour que le résultat soit fourni à 2% près? 


Analyse de l'énoncé et conseils. L’intervalle pour p peut être déterminé par simple 
lecture de l’abaque 2, page 204, ou par l’approximation normale puisque la taille de 
l'échantillon le permet. La longueur de cet intervalle peut s'exprimer en fonction de 
la taille d’échantillon, dont la valeur minimale peut être déterminée pour que cette 
longueur soit inférieure à 4%. 


13. À la sortie d’une chaîne de montage, 20 véhicules automobiles tirés au sort 
sont testés de façon approfondie et 2 d’entre eux présentent des défauts importants. 
Donner un intervalle de confiance de niveau 0,95 pour la proportion p de véhicules 
fabriqués qui présentent des défauts importants. 


Analyse de l'énoncé et conseils. L'interprétation du paramètre p conduit ici à 
construire un intervalle unilatéral à gauche, sans utiliser l’approximation normale 
puisque la taille d’échantillon est trop faible. 
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Moyenne d'une loi normale d'écart type connu 


14. On a effectué 25 pesées d’un objet, avec une balance dont la précision est 
mesurée par l'écart type o = 1. La totalisation de ces pesées étant de 30,25 &, 
donner un intervalle de confiance de niveau 0,90 pour le poids de cet objet. 


Analyse de l'énoncé et conseils. Le résultat d’une pesée peut être considéré comme 
une va. qui suit une loi normale dont la moyenne est égale au vrai poids de l’objet 
et dont l'écart type est la caractéristique de précision fournie par le constructeur de la 
balance. On est alors ramené au problème classique de l'intervalle de confiance pour la 
moyenne d’une loi normale d'écart type connu. 


Moyenne d'une loi normale d'écart type inconnu 


15. Un fabricant d’ampoules électriques annonce une durée de vie moyenne 
de ses ampoules de 170 heures. Afin de vérifier cette affirmation, un organisme 
de défense des consommateurs prélève au hasard 100 ampoules dans un lot de 
fabrication et, à l'issue de l’expérimentation, constate une moyenne de durée de 
vie de 158 heures, avec un écart type empirique de 30 heures. Si on admet que 
cette durée de vie suit une loi normale, peut-on déduire de cette enquête que 
l'affirmation du fabricant est mensongère ? 


Analyse de l'énoncé et conseils. L’affirmation du fabricant peut être validée à partir 
de la construction d’un intervalle de confiance qui devrait contenir la valeur 170. 
En choisissant un niveau de confiance de 99% au lieu de la valeur habituelle 95%, 
l'intervalle obtenu sera plus grand, ce qui est plus favorable au fabricant. Pour que le 
résultat ne puisse pas être contesté, on peut même choisir un intervalle unilatéral de la 
forme m < constante. 


Variance d'une loi normale de moyenne connue 


16. Pour estimer la précision d’un thermomètre, on réalise n = 100 mesures indé- 
pendantes de la température d’un liquide maintenu à une température constante 
de 20 degrés Celsius. Les observations x;, 1 < à < 100, ayant conduit à la valeur 
X'Nx2 = 40011, construire un intervalle de confiance de niveau 0,95 pour la 
précision de ce thermomètre, mesurée par la dispersion 0? des mesures. 


Analyse de l'énoncé et conseils. Si on fait l'hypothèse classique de normalité des 
erreurs de mesure, il s’agit de construire un intervalle de confiance pour la variance 
d’une loi normale, de moyenne connue m = 20. On peut donner un intervalle symé- 
trique, mais compte tenu de l'interprétation du paramètre, il paraît plus logique de 
construire un intervalle donnant une borne supérieure de ce qui mesure en fait l’impré- 
cision du thermomètre. 
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Variance d'une loi normale de moyenne inconnue 


17. Afin de vérifier la régularité des horaires des bus, la RATP a effectué 71 relevés 
des écarts en secondes constatés entre l’arrivée des bus à un arrêt et l'horaire moyen 
constaté. L'estimation sans biais du paramètre o? obtenue a été de 5 100. En déduire 
un intervalle de confiance de niveau 0,95 pour cette mesure de la régularité des 
horaires. 


Analyse de l'énoncé et conseils. On fait toujours l'hypothèse classique de normalité 
des erreurs de mesure, donc il s’agit toujours de construire un intervalle de confiance 
pour la variance d’une loi normale, maïs cette fois de moyenne inconnue. Seuls en effet 
sont ici relevés les écarts à la moyenne empirique. 


Loi de Poisson 


18. Le nombre d'interruptions du trafic de plus d’une minute, dans une journée, 
sur la ligne A du RER, est supposé suivre une loi de Poisson de paramètre inconnu, 
que l’on se propose d'estimer à partir du relevé de ces interruptions sur 200 
journées. Les moments empiriques calculés sur cet échantillon ont pour valeurs 
X200 = 3 et Er = 3,2. En déduire un intervalle de confiance de niveau 0,95 pour le 
paramètre de cette loi de Poisson. 


Analyse de l'énoncé et conseils. On sait que la moyenne empirique est un estimateur 
efficace de la moyenne de la loi de Poisson. La loi exacte de cet estimateur ne pouvant 
pas être utilisée, on construit un intervalle approché à partir de la loi asymptotique, 
déduite du théorème central limite. Pour que les inégalités obtenues ne soient pas trop 
difficiles à exploiter, on remplacera au dénominateur le paramètre par son estimateur. 


Écart type de la loi normale 
19. Soit X une v.a. de loi normale N (0,6) où o est un paramètre réel strictement 


positif, que l’on se propose d'estimer à partir d’un échantillon (X1,...,X,) de cette 
loi. Construire, à partir de: 


1 n 
D, = na 
3 


un estimateur sans biais de o et montrer qu'il est convergent. À partir de l’obser- 
vation D:00 = 1,084, construire un intervalle de confiance de niveau 0,95 pour 0. 


Analyse de l'énoncé et conseils. On détermine les moments de la va. |[X| pour 
construire l'estimateur demandé par la méthode des moments et étudier ensuite ses 
propriétés. L'intervalle de confiance sera obtenu à partir de sa loi asymptotique, déduite 
du théorème central limite. 


114 TD Statistique et probabilités 


Loi exponentielle 


20. La durée de vie d’un certain matériel électronique est une va. X de loi 
exponentielle de paramètre 0 > 0 et (X1,...,X,) est un échantillon de cette loi. 
Déterminer, par la méthode des moments, un estimateur sans biais de 0 et montrer 
qu'il est convergent. Construire un intervalle de confiance de niveau 0,95 pour 8 à 
partir d’un échantillon où on a observé une moyenne empirique %100 = 0,79. 


Analyse de l'énoncé et conseils. On résout l'équation en 8 obtenue par égalisation des 
moyennes théorique et empirique et on ajuste pour obtenir un estimateur sans biais. On 
construira l'intervalle de confiance à partir du théorème central limite donnant ensuite 
la loi asymptotique de cet estimateur à partir de la loi limite d’une suite image figurant 
dans les rappels de cours du chapitre 5. 


Loi exponentielle tronquée 


21. Soit X une va. de densité : 


—(x—8) 


e si x>0 


feo= | 


sinon 


où 6 est un paramètre réel inconnu. Si (X1,...,X,) est un échantillon de cette 
loi, déterminer à partir de m, = min{X1,...,X,} un estimateur sans biais de 0. 
Construire un intervalle de confiance de niveau 0,95 pour 8 à partir d’un échantillon 
où on a observé "M100 = 1,26. 


Analyse de l'énoncé et conseils. Il faut au préalable déterminer la loi de probabilité 
de la valeur minimale de l'échantillon pour ensuite calculer ses moments et en déduire 
un estimateur sans biais. C’est en utilisant la fonction de répartition de m, que l’on 
pourra obtenir un intervalle de confiance de niveau exact 0,95 pour le paramètre. 


Loi de Pareto 


22. Le revenu mensuel X, en francs constants, des ménages d’une population 
donnée est considéré comme une va. de densité : 


5 


fret 


0 sinon 


si x>6 


où 8 est le revenu minimum de cette population. Si (X1,...,X,) est un échantillon 
de cette loi, construire à partir de m, = min{X1,...,X,} un estimateur sans biais 
de 6. Construire un intervalle de confiance de niveau 0,98 pour 8 à partir d’un 
échantillon où on a observé 5300 = 4,04. 
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Analyse de l'énoncé et conseils. On détermine au préalable la loi de probabilité de 
la valeur minimale de l'échantillon pour ensuite calculer les moments et en déduire 
un estimateur sans biais. C’est en utilisant la fonction de répartition de m, que l’on 
pourra obtenir un intervalle de confiance de niveau exact 0,98 pour le paramètre. 


SOLUTIONS 
€. 


| 


1 > Vrai. Il suffit de le choisir suffisamment grand. S’il s’agit d’une proportion, elle 
est contenue dans [0,1] avec une probabilité égale à 1. Si le paramètre est positif, 
l'intervalle [0,+col le contient avec une probabilité égale à 1. 


2 » Vrai. Comme il n’y a qu'une condition pour déterminer les deux bornes de 
l'intervalle de confiance, il y a une infinité de choix possibles. Pour fixer l'intervalle, 
il faut imposer une condition supplémentaire, comme par exemple l'intervalle 
unilatéral à droite ou l'intervalle bilatéral symétrique. 


3 > Faux. La loi binômiale de nf, ne permet pas de construire un intervalle de 
confiance de niveau exact, car c’est une loi discrète. Les abaques permettent cepen- 
dant d'obtenir un niveau très légérement supérieur à celui souhaité, d'autant plus 
proche de la valeur exacte que la taille d'échantillon n est élevée. 


4 » Vrai. La fréquence empirique f, qui est l’estimateur de p a une variance pro- 
portionnelle à p (1 — p), produit de deux termes dont la somme est constante et qui 
est maximal quand ils sont égaux, soit p = 0,5. C’est donc au voisinage de cette 
valeur que l'intervalle de confiance sera de longueur maximum. 


5 > Vrai. La loi de l’estimateur moyenne empirique étant la loi normale symé- 
trique, la longueur de l'intervalle symétrique par rapport à son centre sera mini- 
male. 


6 > Faux. Si la loi de l’estimateur dépend d’un autre paramètre inconnu qu'il faut 
estimer, cette longueur peut être une variable aléatoire, comme dans le cas de 
l'intervalle de confiance pour la moyenne d’une loi normale d'écart type inconnu. 


7 » Faux. Si on prend l'exemple de l'intervalle de confiance pour la moyenne 
d'une loi normale, l'énoncé est vrai si l'écart type est connu, mais faux dans le 
cas contraire. En effet, dans ce dernier cas, l'intervalle est de longueur aléatoire 
Ly = 245,/Vn, qui tend cependant en probabilité vers zéro quand n tend vers 
l'infini. 

8 > Bien sûr, aucune de ces deux réponses n’est satisfaisante. Le paramètre p étant 
positif, on pourrait retenir l'intervalle 0 < p < 0,10 qui est bien de niveau supérieur 
à 0,95 mais très approximatif puisqu'il correspond au cas, le plus défavorable, d'un 
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paramètre voisin de 0,5 alors que manifestementici il est proche de zéro ! Rappelons 
d'autre part que l’approximation normale n’est considérée comme justifiée que 
si np(1—p) > 3, donc il faudrait que p soit supérieur ici à 4%. Il faut donc 
avoir recours à l’abaque 2, page 204, qui va fournir l'intervalle le plus exact, soit 
0 < p < 0,04. Cependant, si on ne dispose pas de cet abaque, on peut quand même 
partir de l’approximation normale donnant l'intervalle symétrique : 


Pn = P 
Pa < Vn <a)=1-0 
( VPq 


avec ici Pro — 0. Mais on n’utilisera pas la seconde approximation de p par 100 
au dénominateur puisque cette valeur est nulle. Pour 1 — « = 0,95 on lit a = 1,9 
donc on est amené à résoudre les inégalités : 


—P 
—1,96 < nn —= < 1,9% 
VPi 


Comme p > 0, cela se réduit à : 


en 
Ep 
soit l'intervalle de confiance : 
1,96? 
Te —, —(} (4 
0 <p < 14106 0,0 


9 » Sion associe à chaque dossier du fichier une variable de Bernoulli X qui prend 
la valeur 1 quand il n’est pas exploitable, on aura P(X = 1) = p qui représentera 
la proportion de dossiers inexploitables. Si on prélève n dossiers, il y en aura 
n —)};_ X; qui pourront être utilisés. La condition imposée se traduit donc par 
P(n—3, X; > 1000) = 0,95 quipeutencores’écrire P(X, < 1 — 1000/n) = 0,95. 
La quantité 1 — 1000/n peut donc s’interpréter comme la borne supérieure d’un 
intervalle de confiance unilatéral pour une proportion, de niveau 0,95. Ayant 
observé sur un échantillon de taille 100 la valeur f100 = 0,2, on obtient par lecture 
de l’abaque 1, page 203, l'intervalle p < 0,28, ce qui correspond à la valeur de n 
telle que 1000/n = 0,72, soit n = 1 389. 


10 > On applique la formule donnée dans les rappels de cours avec #39 = 2000 
et s = 300, la table 6 donnant comme fractile d’ordre 0,975 de la loi de Student 
à 29 degrés de liberté la valeur { = 2,045. L'intervalle de confiance obtenu est 
donc 1888 < m < 2112. L’estimation de © étant exactement égale à la valeur 
de ce paramètre, on aurait pu penser que l'intervalle ne serait pas modifié. Mais 
l'application des formules du cours dans le cas où o est connu, avec comme fractile 
d'ordre 0,975 de la loi normale u = 1,96, conduit à l'intervalle 1 893 < m < 2107. 
Sa longueur est 214, légèrement inférieure à celle, 224, de l'intervalle précédent. 
Ainsi, même dans le cas d’une estimation sans erreur, le fait d'estimer un paramètre 
inconnu fait perdre de l'information et donc fournit un intervalle moins précis. 
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11 > Si X est la va. qui représente la dépense consacrée aux loisirs, de loi supposée 
normale N (m,6), on ne dispose pas ici de 1 000 observations de cette variable, mais 
seulement de l'échantillon des moyennes empiriques M, 1 < j < 5, c'est-à-dire 


d'une va. M qui suit une loi N (m, 6/V 200). L’intervalle de confiance pour m est 


donc basé sur la statistique V5 (Ms — m) /S; qui suit une loi de Student à quatre 
degrés de liberté. Il est donc de la forme : 


S = S 
Ms — 1 <m<Ms +1 


VE VE 


où t est le fractile d'ordre 0,975 de la loi T; lu dans la table 6, page 200, soit 
t = 2,776. L'intervalle obtenu est donc 282 < m < 320. L'amplitude assez élevée 
de cet intervalle, malgré une taille d’échantillon importante, s'explique par une 
grande dispersion du caractère mesuré dans les cinq groupes, qui paraissent assez 
dissemblables quant à leur comportement vis-à-vis des loisirs. 


12 > La lecture de l’abaque pour n — 100 et Pioo — 0,51 donne l'intervalle 
0,42 < p < 0,62. Le fractile d'ordre 0,975 de la loi normale a comme valeur a = 1,96, 
ce qui fournit comme nouvel intervalle approché 0,41 < p < 0,61 de même 
longueur que le précédent mais décalé de 1% vers la gauche. Enfin, en rem- 
plaçant p (1 —p) par sa borne supérieure 1/4, on obtient le même intervalle, ce 
qui s'explique par la valeur exacte de p qui doit être effectivement proche de 0,5. 
Pour une taille d’échantillon nr = 1000, on ne peut plus utiliser l’abaque, mais 
l’approximation normale fournit un intervalle précis, soit ici 0,48 < p < 0,54 de 
longueur 6 %. Pour une taille d’échantillon r quelconque, la longueur de l'intervalle 
est : 


Pn (1 — Pa) 
nl 


l, = 24 


et la condition l, < 0,04 impose n > 2500a°ÿ, (1 — P,). Pour une estimation voisine 
ici de 0,5, on aboutit à la contrainte 7 > 2400. Dans le cas le plus défavorable d’une 
proportion voisine de 50%, il faut donc des tailles d’échantillon élevées pour 
l’estimer avec précision. 


13 > On obtient ici Pr = 0,10 et 1p20 (1-20) = 1,8, ce qui n'autorise pas à 
admettre que np (1—p) > 3, condition de validité de l’approximation normale. 
L'intervalle unilatéral exact est fourni par l’abaque 1, page 203 : p < 0,28. L’utili- 
sation de l’approximation normale avec le fractile d'ordre 0,95 a = 1,6449 aurait 
donné l'intervalle p < 0,21 assez éloigné de l'intervalle exact. 


14 > On peut considérer que la valeur indiquée par la balance est une va. X de 
loi normale, d'espérance m égale au poids réel de l’objet et d'écart type o = 1. Le 
fractile d'ordre 0,95 de la loi normale étant u = 1,6449, l'observation a ki 
30,25 conduit à l'estimation ponctuelle x: = 1,21 puis à l'intervalle de confiance 
0,88 < m < 1,54. Compte tenu du petit nombre de mesures et de la valeur élevée 
de l'écart type, cet intervalle est peu précis. 
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15 > Pour construire un intervalle de confiance pour la moyenne m de cette loi 
normale d'écart type inconnu 0, on utilise la statistique /7 (X — m) /S, qui suit 
une loi de Student à n — 1 degrés de liberté. Avec ici n = 100, on lit dans la table 6 le 
fractile d'ordre 0,995 : { = 2,63. On obtient comme intervalle bilatéral symétrique : 
150 < m < 166. La valeur indiquée par le fabricant est bien en dehors de cet 
intervalle. Si on choisit un intervalle de même niveau, mais unilatéral à gauche, il 
sera défini par : 


Xn—Mm 


P 7 > ] = 0,99 
soit { — 2,37 et l'intervalle m < 165.11 y a donc 99 chances sur 100 que cette publicité 


soit mensongère. 
16 > On obtient comme estimation de la variance : 


100 


= 1 
dy = 100 2* — m = 0,11 


Les fractiles d'ordre 0,025 et 0,975 de la loi du khi-deux à 100 degrés de liberté, lus 
dans la table 5, page 199, sont respectivement 4 = 74,22 et b = 129,56, d'où 
l'intervalle bilatéral symétrique 0,08 < o? < 0,15. Si on retient un intervalle 
unilatéral à gauche, le fractile d'ordre 0,05 est a = 77,93, ce qui donne comme 
intervalle 6? < 0,14. 


17 » Pourunintervalle de confiance bilatéral symétrique, on relève dans la table 5 
les fractiles d'ordres respectifs 0,025 et 0,975 à 70 degrés de liberté a — 48,76 et 
b — 95,02, d'où 3757 < 0? < 7322. Pour un intervalle unilatéral à gauche, le 
fractile d'ordre 0,05 est a = 51,74, ce qui donne comme intervalle 0? < 6900. 


18 > D'après le théorème central limite, l’estimateur du paramètre 6, centré et 
réduit, converge en loi vers la loi normale centrée et réduite : 


X,—0 
N (0,1 
Vn NA (0,1) 


Les inéquations que l’on peut en déduire s'exprimant en fonction de 8 et VB, 
on remplace le paramètre au dénominateur par son estimateur et l'intervalle de 
confiance bilatéral symétrique se déduit de la condition : 

X,—0 
V x 
où on retient comme valeur approchée de u le fractile d'ordre 0,975 de la loi N (0,1), 

soit u = 1,96. L'intervalle obtenu est alors : 


DRE Le - [x : be 
u] = <X,-0<u— = X,-u) —<8<X,+u) — 
nl nl n n 


soit pour cet échantillon 2,76 < 8 < 3,24. 


P[u< u]= 098 
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19 > Pour calculer l'espérance de |X|, on fait le changement de variable 2o?u = x? : 


1 fre 20 ft E] 
E(IX|) = L xl e 72 ax = © e"" du = 01) = 
OV2T J-œ0 427 Jo T 


L'expression de la variance se déduit aisément de la formule développée : 


V (IX) = E(IXP) — E (IX) = o? 2e = (1 =) o? 


L’estimateur de o obtenu par la méthode des moments est solution de D, = 6/2/x, 
puisque D, est la moyenne empirique de l'échantillon (|X:1,...,|X,1). La solution 
est l’estimateur, sans biais par construction : 


T 
Th = 7 Pr 


Il est convergent, d’après la loi des grands nombres, puisque : 


2 
D, = E(IXD = o)= 
p TT 


Cet estimateur étant sans biais et de variance : 
ae 


T TT T 
VOD) = 5 VOD) = SV (IX) = (5-1) 
(Th) 5 (Dh) ce (IXD 5 : 
qui tend vers zéro, est d’ailleurs aussi convergent en moyenne quadratique. Sa loi 
asymptotique va se déduire du théorème central limite : 


D; — E (IXD 


‘ o (IX) 


— N(0,1) 
loi 
En multipliant numérateur et dénominateur par /x/2, on obtient en effet : 


Th 
7, N(0,1) 


es — 1 loi 


On peut alors obtenir un intervalle bilatéral symétrique de niveau voisin de 0,95 
par la relation : 


P ie 0,95 
—u < Jn © <u|=0, 
o/7/2 —1 


en prenant pour valeur approchée de u le fractile d'ordre 0,975 de la loi N (0,1), 
soit u = 1,96. La résolution de cette double inégalité conduit à : 


x—-2 Tr —2 
— UO on <T, —06 <uo 5h & 
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D'où l'intervalle pour l'écart type : 
Th Lo < Th 
1+ uo/(x — 2) /2n 1— uo/(x — 2) /2n 
Soit, pour cet échantillon, l'intervalle de confiance : 1,16 < © < 1,56. 


20 > Onsait que la moyenne théorique de la loi exponentielle € (8) est E (X) = 1/8, 
donc la méthode des moments conduit à résoudre l'équation en 0 : 1/0 = X,. La 
solution fournit l’estimateur ê, = = 1/X,. La loi exponentielle est la loi y(1,0); 
donc nX, = Sy = >. X; suit une loi y (n,0), dont la densité permet de calculer 
l'espérance de cet estimateur : 


E(@;) nE ( : ) _ Î rer? q 
n) = — |] = x x 
Sn F(n) Jo 


[” Qu"2e"" du = LE mn) = 
F (n) n—1 


Tu 
Cet estimateur est asymptotiquement sans biais, l’estimateur sans biais étant : 


ne #1 
n Sy 


La loi des grands nombres permet d'obtenir la convergence en probabilité de X, 
vers E (X) = 1/8 et le théorème de Slutsky permet de conclure que 1/X, converge 
vers 0, donc aussi T, puisque (n — 1) /n tend vers 1. On peut aussi calculer la 
variance de cet estimateur à partir de : 


1 1 +00 e2 +00 
E (=) _ Î pre xx dx = Î ue t du 
Si F (7) Jo F(n) Jo 


T2 e? 
F(n) _(n—1)(n—2) 


D'où on déduit V(1/S,) = 82/ (n — 1)? (n — 2), puis : 


V(Ty) = (n—1ÿ V (5) = 


qui tend vers zéro quand ñn devient infini. Donc, T, converge en moyenne qua- 
dratique vers 6, puisqu'il est sans biais. La loi de T, n’est pas une loi tabulée qui 
permet de construire un intervalle de confiance, donc on utilise la loi asymptotique 
déduite du théorème central limite : 


X, — 1/0 
ET 1 
Vn T7 = N(,1) 


car, pour la loi exponentielle & (8), V (X) = 1/87. Pour obtenir la loi asymptotique 
de 8, = 1/X, on applique le résultat relatif à la loi limite d’une suite image vue 
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au chapitre 5, avec 6, = g (a) et g (x) = 1/x, soit g’ (x) = —1/x2 et |g’ (1/0)] = 62, 
d'où : 


6, —8 
Vn—=—— — N(0,1) 
loi 
À x n—1= . n—1 
Le résultat est le même pour T, = ne 0, puisque tend vers 1 quand n 


devient infini. On obtient donc un intervalle de confiance bilatéral symétrique pour 
6 à partir de la condition : 


Tr — 8 
( 


P E < Vn < »| = 0,95 


en remplaçant u par le fractile d'ordre 0,975 de la loi normale centrée-réduite, soit 
u = 1,96. La résolution de cette double inégalité pour 8 conduit à l'intervalle : 


u à T, — 0 — Tu Q Tu 
—U—= < —0 <u— — © < 0 < ———— 
An” Vn 1+u/4n 1 = 4/9" 


Soit, pour cet échantillon 1,05 < 0 < 1,56. 


21 > Pour déterminer la loi de M = min{X1,...,X,}, on considère l'événement 
Mn > X qui est équivalent à l'événement tous les X; sont supérieurs à x. Les va. X; 
étant indépendantes et de même loi de fr. F, on en déduit : 


P (Mn > x) elfe > ») =[[PG-d=n-F6;:07 
i=1 i=1 


La f.r. de X est nulle pour x < 8 et d'expression : 
X 
Fi) Î e F9 d4=1-e 00 
0 


pour x > 0. La fr. de m, est donc aussi nulle pour x < 8 et définie par : 
G(x ;0) = 1—e77%70 


pour x > 0, sa densité étant g(x:0) = ne". On peut alors calculer son 
espérance : 


O0 


+00 +00 + 
Efnj=# Î xe"@-9 dx = n Î (x — 8)e "9 ax + On Î er dr 
ô ô o 


1 +00 +00 1 
=: ue " du +0 g(x:0) dx =-+08 
n Jo 0 n 


la première intégrale étant l'espérance d’une loi exponentielle de paramètre 1 et la 
seconde l'intégrale de la densité de m,. L'estimateur sans biais construit à partir de 
m, est donc T, = m, —1/n. Comme m, > 6,on aura T, > 86—1/n; donc l'intervalle 


122 TD Statistique et probabilités 


retenu sera de la forme T, — a < 0 < T, + 1/n. La fr. de m, va permettre de 
déterminer un intervalle de confiance de niveau 1 — à par la condition : 


1 1 
1-u=P(-5<T,-0<)=P(0<m, <0+n+) 
n n 
1 1 —na—1 
= G hate —G(0:8)=G{[0+a+-:0]=1-e " 
n 
soit a = e (D ou a = — (1 +Ina) /n, ce qui correspond à l'intervalle : 
Ino 
Mn + — <0<My 
n 


Pour cet échantillon , on obtient l'intervalle : 1,23 < 0 < 1,26. 


22 >» Comme dans l'exercice précédent, on détermine la loi de m, = 
min{X1,...,X,} à partir de: 


P(my > x) elfe > ») = [Penn Fré;0T 


i=1 


La fr. F de X est nulle pour x < 8 et d'expression : 


FG0 236 [ = [FT = 1 — 


pour x > 0. La fr. de m, est donc aussi nulle pour x < 8 et définie par : 


3n 
G&i9=1- (©) 
X 


pour x > 6, sa densité étant g (x ; 0) = 3n0%/x%+1, On peut alors calculer son 
espérance : 


de 1 + 4 
E(m,) = 3 — dx = 378% | = = ———06 
(in) " [ xn * ds | (3n — 1) x$1-1 | 3n — 1 


; is 3n —1 | _ 
L'estimateur sans biais est donc T, — an lé En raison de la condition m, > 0 
n 


et la fr. de m, dépendant de x/6, l'intervalle de confiance de niveau 1 — à est 
déterminé par la condition : 


1—-a—= P(0 <m, —0 < 40) = P(8 < m, < 0 +40) 


1 
= G(0 + 48 ; 06) — G(0 ; 0) = G(0 + 48 ; 0) = 1 — —— 
( ) el + a)" 
soit (1 +4)” = 1/a ou In(1 + 4) = —Ina/3n. L'intervalle pour le paramètre est : 
Ma 
<0<m;y 
1+4 


Pour & = 0,02 et n = 300, on obtient a = 0,004 et l'intervalle 4,02 < 6 < 4,04, donc 
intervalle très étroit. 
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TE Théorie 
des tests 


(1 L'ESSENTIEL DU COURS 


Bâtir un test nécessite, comme pour un problème d'estimation, de construire au préalable 
un modèle statistique où la v.a. X suit une loi de probabilité P9, qui dépend d'un paramètre 
6 inconnu. On fait l'hypothèse a priori que la valeur de ce paramètre est égale à une valeur 
fixée 09 et on cherche à valider cette hypothèse, au vu d'un échantillon de la loi de X. Cette 
hypothèse qui est privilégiée, parce qu'elle paraît la plus vraisemblable à priori, est appelée 
hypothèse nulle et notée Ho. Construire un test va consister à découper l'ensemble R'" des 
réalisations possibles du n-échantillon en deux régions, celle où l'on décidera d'accepter 
H, et celle où on décidera de la rejeter, qui se nommera région critique du test. Pour 
délimiter ces deux régions, on fixera une valeur faible à la probabilité de l'erreur qui 
consiste à décider, au vu de l'échantillon, de rejeter l'hypothèse nulle alors que celle-ci est 
vérifiée. Cette probabilité se nomme risque de première espèce, sa valeur standard étant de 
5 %. Lorsque le paramètre © ne peut prendre que deux valeurs distinctes 09 et 61, c'est le 
théorème de Neyman et Pearson qui permet de déterminer la forme de la région critique, 
à partir du rapport des vraisemblances associées à chacune des deux valeurs possibles du 
paramètre. 


1. Définitions et principe général de construction 


On considère un modèle statistique où la loi de probabilité P, de la va. X dépend 
d'un paramètre inconnu © qui varie dans un sous-ensemble donné © de R. On 
suppose que cet ensemble est partitionné en deux sous-ensembles donnés O5 et O1, 
auxquels vont être associées les deux hypothèses notées Ho : 8 € Oo et Hi : 0 € O1. 
Construire un test consiste à définir une règle de décision qui va associer une décision 
à un échantillon observé (X1,...,X,) de la loi de X, les deux décisions possibles 
étant D, : accepter H6, et Di : accepter Hi. À chaque décision correspond une région 
de R’}, qui va donc être partitionnée en deux sous-ensembles W et W, c'est-à-dire 
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que si la réalisation de l'échantillon est un point (x1,...,x,) de W, on décide D:, 
donc on rejette H5 ; dans le cas contraire, c’est-à-dire pour un point de W, on décide 
Do, donc on accepte Hs. 


Définitions. La région W de rejet de l'hypothèse nulle HÇ se nomme région critique 
du test et la région W région d'acceptation. 


La construction d’un test va donc consister à déterminer cette région critique et la 
méthode retenue dépendra des conséquences que l’on attribue à chacune des deux 
erreurs qui sont associées aux deux décisions possibles et qui sont les suivantes. 


Définitions. L'erreur de première espèce consiste à décider D: alors que Hi est vraie, 
soit rejeter à tort l'hypothèse nulle H. L'erreur de seconde espèce consiste à décider 
Do alors que Hi est vraie, soit accepter à tort l'hypothèse nulle Hs. 


2. Méthode de Bayes 


On se place dans le cas où on a attribué des probabilités 4 priori po et p1 = 1 — po 
à chacune des hypothèses respectives Ho et Hi et que l’on a également associé un 
coût à chaque décision, en fonction de l'hypothèse qui est effectivement réalisée. 
Le tableau suivant contient ces coûts, la décision prise figurant en colonne et 
l'hypothèse vraie en ligne : 


Do D; 
Ho (po) Coo Cor 
Hi (p1) Cio Cu 


Après la réalisation (x1,...,x,) on peut calculer, à l’aide du théorème de Bayes, les 
probabilités a posteriori x et x1 des hypothèses H, et Hi : 


poLo pil 
T0 = RES —————— 
poLo + pila poLo + pila 


où on a noté Lo la valeur de la vraisemblance L (x1,...,x, ; 0), quand 8 € Oo, et La, 


quand 60 € @1. On peut alors calculer les espérances du coût de chaque décision 
pour cette distribution 4 posteriori : 


E[C (Do)] = Cooxo + Com et E[C(Di1)] = Coito + Cum 


La règle de décision de Bayes consiste à associer à l'observation (x1,...,x,) la décision 
dont l'espérance de coût est la plus faible. 


© Dunod. La photocopie non autorisée est un délit. 


TD 8 e Théorie des tests 125 


3. Méthode de Neyman et Pearson 
3.1 Principe de la règle de Neyman et Pearson 


On privilégie une hypothèse que l’on considère comme la plus vraisemblable et 
que l’on choisit comme hypothèse nulle Ho. Ce sera celle dont le rejet à tort sera le 
plus préjudiciable. L'autre hypothèse H: est l'hypothèse alternative. 


Définitions. On appelle risque de première espèce la probabilité de rejeter à tort 
l'hypothèse nulle, soit : 


a = P6(DilHo) = P(HilHo) = Pa(W]8 € @0) 


On appelle risque de seconde espèce la probabilité d'accepter à tort l'hypothèse nulle, 
soit : 


B = Po(DolHi1) = Po(HolH1) = P5(W]8 € @1) 


Privilégier l'hypothèse nulle revient à considérer que l'erreur la plus grave consiste 
à la rejeter à tort. La méthode de Neyman et Pearson fixe un seuil maximum 09 au 
risque de première espèce et le test est alors déterminé par la recherche de la règle 
qui minimise l’autre risque de seconde espèce. 


Définition. On appelle puissance d’un test la probabilité de refuser H, avec raison, 
c'est-à-dire lorsque Hi est vérifiée, soit : 


n = P(DilHi) = Po(Hi|H5) = Pe(W]8 € @:) = 1 —-$ 


La règle de décision de Neyman et Pearson consiste à déterminer la région critique W 
pour laquelle la puissance est maximum, sous la contrainte à < oo. 


3.2 Hypothèses simples 


Une hypothèse est qualifiée de simple si la loi de la va. X est totalement spécifiée 
quand cette hypothèse est réalisée. Dans le cas contraire, elle est dite multiple. Nous 
allons examiner le cas où le paramètre 8 ne peut prendre que deux valeurs 69 et 61, 
ce qui correspond au choix entre les deux hypothèses simples suivantes : 


Ho : 8 = % 
H:0—=86; 


Théorème de Neyman et Pearson. Pour un risque de première espèce fixé à oo, le 
test de puissance maximum entre les hypothèses simples ci-dessus est défini par 
la région critique : 
Lo (Ki, 23% 
W = Lx pe <H] 
Li (1, ve 1 Xn) 


où la valeur de la constante k est déterminée par le risque fixé &o = Pa (W]8 = 60), 
ayant posé Lo (x1,...,Xn) = L(x1,...,Xu ; 00) et Li (x1,...,Xn) = L(X1,...,Xn 5 01). 
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3.3 Hypothèses multiples 


Nous allons seulement considérer le cas d’une hypothèse simple contre une hypo- 
thèse multiple de la forme suivante : 


Ho : 0 = 6% 
Hi :0 £ 6% 


On détermine d’abord par la méthode de Neyman et Pearson la région critique W 
du test suivant : 


Ho : 8 — 6% 
H:0—=86; 


où 0, est une valeur fixée différente de 85. Si W ne dépend pas de 61, alors on aura 
obtenu un test uniformément le plus puissant (UPP), c'est-à-dire que pour toute autre 
région critique W, on aura P, (W|8 € 61) > Po (W/18 € @1) pour tout 8 de @1. 


Théorème de Lehmann 


H : 0 < 6 
H: : 0 > 6 


On suppose que la loi P, est à rapport des vraisemblances monotone, c’est-à-dire 
qu'il existe une statistique T, telle que : 

L(x,. cr Xn 0) 

L (1, cs Xn ; 9") 
soit une fonction croissante de T, pour toutes les valeurs 8 > 6". 


Alors, il existe un test UPP de niveau 0, de région critique définie par la condition : 


T, > k. 


4. Tests du khi-deux 
4.1 Test d'indépendance 


Pour tester l'indépendance de deux caractères X et Y, qualitatifs ou quantita- 
tifs, à respectivement r et s modalités, on relève le nombre n;; d'individus d’une 
population de taille n = Y';_; Y;_1 nÿ qui possèdent simultanément la modalité 
i, 1 < i < r, du caractère X et la modalité j, 1 < j < s, du caratère Y. Si 
. est la probabilité théorique correspondante, les probabilités marginales sont 

=»; 1 Pi etp.; = » A pi et l'indépendance de ces deux caractères se traduit par 
L diese nulle H6 : pi = pi. x p.. Pour tester cette hypothèse contre l'alternative 
Hi: pi À pi x p;, on utilise la statistique : 


r 5 
njÿ-nin;/n ni; 
DEN 
ninj/n nin; 


i=1 j=1 11 i=1 j=1 
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dont la loi asymptotique sous H, est la loi du khi-deux à (r — 1) (s — 1) degrés de 
liberté. On a posé ni, = 3}; nijetn; =; nj. La région critique de ce test est de 
la forme D, > C; pour un risque de première espèce à = P(D, > C|Ho), la valeur 


de C est approximée par le fractile d'ordre 1 — à de la loi x£,_1,_- 


4.2 Test d'adéquation 


Pour tester l'hypothèse nulle qu'une va. X admet pour fonction de répartition 
une fonction donnée F, on utilise un n— échantillon de la loi de X. Si la loi 
est discrète, avec K valeurs possibles de probabilités p; = P(X = x;), ou si les 
observations continues ont été réparties en k classes disjointes (4i,4;41), avec cette 
fois p; = P{X € (ai,ai:1)} = E (ai:1) —E (ai), on compare cette distribution théorique 
avec la distribution empirique définie par les valeurs n;/n, où n; est le nombre 
d'observations x; ou appartenant à la classe (ai,4;,1). On utilise comme distance 
entre ces deux distributions la statistique : 


2. k 


Dee pe ä 


np; np; 
i=1 Pi a "Pi 


dont la loi asymptotique sous H, est la loi du khi-deux à k — 1 degrés de liberté. La 
région critique de ce test est de la forme D, > C. Pour un risque de première espèce 
a = P(D, > ClHb), la valeur de C est approximée par le fractile d'ordre 1 — à de 
la loi x?_,. On considère que cette approximation est possible si np; > 5; en cas 
d’effectif de classe trop petit pour que cette condition soit remplie, on regroupe 
des classes contiguës. Si la loi de X sous Ho dépend de r paramètres qu'il a fallu 
estimer au préalable, le nombre de degrés de liberté de la loi asymptotique devient 
k—r—1. 


() POUVEZ-VOUS RÉPONDRE ? 
SR 


Vrai Faux 
1. Pourun problème de test donné, choisir une valeur importante 
de la probabilité a priori po de l'hypothèse nulle dans la méthode 
de Bayes est équivalent à choisir une valeur faible du risque de 
première espèce à dans la méthode de Neyman et Pearson. 0] (n 
2. Les deux hypothèses d’un test de Neyman et Pearson jouent 
des rôles symétriques. (In O 
3. Le risque de seconde espèce 8 est toujours plus grand que le 
risque de première espèce o. [] (5 


4. Sans information a priori, chacune des deux hypothèses peut 
indifféremment être choisie comme hypothèse nulle, dans un test 
de risque de première espèce fixé 0. (In O 
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Vrai Faux 
5. Dans le cas d’un test entre deux hypothèses simples, on peut 
toujours calculer sa puissance. O (a 
6. Dans le cas d’un test entre deux hypothèses simples, on peut 
toujours trouver un test de risque de première espèce fixé a. OU 
7. Si on intervertit les deux hypothèses simples d’un test, la 
conclusion au vu du même échantillon peut être changée. OU 


4 
le QUESTIONS DE RÉFLEXION 
de 


8. Le nombre X d'incidents graves par an survenus dans l’une des centrales 
nucléaires françaises, suit une loi de Poisson de paramètre À. Disposant de sta- 
tistiques sur les neuf dernières années, construire un test de risque de première 
espèce à = 0,05 entre les deux hypothèses suivantes : 


Ho : À =2 
H:Xx=1 


9. Un générateur de nombres au hasard permet d'obtenir une simulation de la 
loi uniforme sur l’ensemble des dix chiffres {0,1,...,9}. La distance entre la distri- 
bution empirique obtenue sur un échantillon de n = 100 chiffres et la distribution 
théorique a pour valeur Diw = 2,1. Le fractile d'ordre 0,95 de la loi x3 étant 16,9, 
on accepte l'adéquation à la loi uniforme. Si la même distribution empirique est 
obtenue sur un échantillon de taille N = 1000, expliquer pourquoi cette fois on 
refuse l'adéquation à la loi uniforme. 


(1 ENTRAÎNEMENT 


Méthode de Bayes 


10. Un magasin propose aux acheteurs d’un téléviseur de souscrire pour 300F 
une garantie complémentaire de cinq ans pour le remplacement du tube-image, 
d'une valeur de 2500F. On sait par ailleurs que 80% de ces téléviseurs sont 
fabriqués en Asie et que la probabilité de défaillance du tube-image est alors 
p = 0,15. Le reste des appareils est fabriqué en Europe, avec dans ce cas p = 0,05. 
En interrogeant vingt anciens acheteurs, on apprend que deux d’entre eux ont eu 
à changer leur tube dans les cinq ans qui ont suivi leur achat. Cette information 
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conduit-elle à souscrire à cette garantie? Une garantie à 350F ferait-elle changer 
d'avis? 


Analyse de l'énoncé et conseils. Pour utiliser la méthode de Bayes, il faut construire le 
tableau des coûts. Sion ne prend pas la garantie, on détermine le coût moyen qui dépend 
de la valeur de p. La vraisemblance est associée ici à un échantillon d’une loi de Bernoulli 
qui prend la valeur un quand le tube est en panne dans les cinq années après l'achat. 


11. Une entreprise possède cinq photocopieuses sur lesquelles neuf interventions 
ont été nécessaires l’année précédente, avec un coût moyen par intervention de 
1000F. Une société lui propose un contrat d'entretien de 2400F par an et par 
machine. Le nombre annuel de pannes est supposé suivre une loi de Poisson de 
paramètre À. Pour le quart des machines produites la valeur du paramètre est = 3. 
Une amélioration du procédé de fabrication a permis d'obtenir ensuite À = 1 pour 
la production des trois quarts restants. Compte tenu de ces informations, quelle 
sera la décision de l’entreprise? 


Analyse de l'énoncé et conseils. Le coût moyen en l'absence de contrat dépend du 
paramètre À qui représente l'espérance de la loi. La vraisemblance d’un échantillon 
d'une loi de Poisson permet ensuite de construire la règle de Bayes et de conclure au 
vu des observations faites. 


Comparaison des méthodes de Bayes et de Neyman-Pearson 


12. Le dirigeant d’une grande marque de vêtements pense qu’une campagne 
publicitaire choquante aurait une chance sur deux de réussir. Avant de lancer 
cette campagne à l'échelon national, une pré-campagne a été effectuée dans cinq 
grandes villes, ce qui a conduit à une augmentation de bénéfices pour cette marque 
de quatre millions de francs au total. On admet que l'accroissement de bénéfices 
dans une ville est une v.a. de loi normale d'écart type connu o = 2 et de moyenne 
m = 2 si la campagne a été efficace et m = 0 dans le cas contraire. Sachant que le 
coût par ville de cette campagne est de 0,5 million de francs, quelle décision ces 
informations conduisent-elles à prendre? Quelle serait la règle de décision dans 
l'optique de Neyman-Pearson où on souhaiterait avant tout limiter le risque de 
ne pas lancer une campagne qui serait efficace? Même question dans le cas où la 
campagne est considérée comme efficace dès que m > 0? 


Analyse de l'énoncé et conseils. On traduit d’abord les informations données pour 
construire le tableau des coûts. On écrit ensuite la vraisemblance d’un échantillon de 
taille cinq d’une loi normale d'écart type donné, ce qui permet d'établir la règle de 
Bayes et de conclure au vu des observations recueillies après la pré-campagne. On 
construit ensuite la règle de décision de Neyman-Pearson associée à l'hypothèse nulle 
retenue par ce dirigeant. Cette règle dépend bien sûr du risque de première espèce a 
retenu et on verra que la conclusion est différente selon les choix à = 0,05 eta = 0,10. Le 
changement d’hypothèse nulle proposé ensuite conduit à modifier très sensiblement 
cette règle. 
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Test d’une proportion 


13. Entre les deux tours de l'élection présidentielle, le candidat D. Magog com- 
mande un sondage à une société spécialisée pour connaître ses chances d’être élu. 
Si p est la proportion d’électeurs qui ont l'intention de voter pour lui, cette société 
est conduite à effectuer le test entre les hypothèses simples suivantes : 


Hi :p = 0,52 


a) Indiquer le sens que l’on peut accorder à ce choix d’hypothèse nulle et déter- 
miner la région critique du test de risque de première espèce « = 0,10 dans le cas 
d'un sondage réalisé auprès de n = 100 électeurs. On calculera ensuite la puissance 
pour des valeurs de n égales à 100, 500 et 1 000. 


É : p = 0,48 


b) On considère maintenant le test suivant : 


Ho : p = 0,49 
Hi :p=0,51 


Déterminer la taille d’échantillon minimum pour que la puissance soit supérieure 
à 0,90 et indiquer dans ce cas la région critique. 


Analyse de l'énoncé et conseils. On utilise le théorème de Neyman et Pearson pour 
déterminer la forme de la région critique de ce test entre deux hypothèses simples. On 
introduit pour cela une variable de Bernoulli indicatrice de l'intention de vote pour le 
candidat D. Magog, de paramètre p. La taille de l'échantillon permet d'utiliser la loi 
asymptotique de la statistique qui sert à délimiter cette région critique, pour déterminer 
une valeur approchée du seuil en fonction du risque de première espèce fixé. Pour 
calculer la puissance du second test en fonction de différentes tailles d’échantillon, on 
exprimera ce seuil en fonction de la taille n. 


Test de la moyenne d'une loi normale d'écart type connu 


14. On dispose d’un échantillon (X1,...,X,) d’une va. X qui suit une loi normale 
d'espérance inconnue m et d'écart type connu o = 2 pour choisir entre les deux 
hypothèses : 


H:m=2 
H :m=3 


Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance 
dans le cas où n — 100 et a = 0,05. Quelle devrait être la taille d’échantillon 
minimum pour que cette puissance soit supérieure à 0,95? 0,99? 


Analyse de l'énoncé et conseils. On détermine la forme de la région critique de ce test 
par le théorème de Neyman et Pearson, en faisant le rapport des vraisemblances asso- 
ciées aux deux hypothèses simples. On transforme les inégalités successives obtenues 
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en ne conservant que les termes dépendant de x1,...,x, et en remplaçant les autres 
par une nouvelle constante. On aboutit à la définition d’une région critique qui fait 
intervenir une statistique dont on connaît la loi de probabilité sous l'hypothèse nulle, 
ce qui permet de déterminer le seuil de la région critique en fonction du risque de 
première espèce fixé. On peut ensuite calculer la puissance du test comme probabilité 
de cette région critique, cette fois en se plaçant dans l'hypothèse alternative. 


Test de la moyenne d'une loi normale d'écart type inconnu 


15. On dispose d’un échantillon (X1,...,X,) d’une va. X qui suit une loi normale 
d'espérance inconnue m” et d'écart type inconnu o, pour choisir entre les deux 
hypothèses : 


H:m=1 
H :m=2 


Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance 
dans le cas où n = 25 et à = 0,05. 


Analyse de l'énoncé et conseils. La démarche est identique à celle de l'exercice 
précédent, maïs la région critique est déterminée à partir d’une statistique dont la loi 
n'est pas connue sous l'hypothèse nulle. Il faudra donc modifier cette statistique par 
l’utilisation d’un estimateur de l'écart type, qui est inconnu ici, et définir la région 
critique à l’aide d’une statistique de loi connue sous Ho. 


Test de l'écart type d'une loi normale de moyenne connue 


16. Un fabricant de thermomètres prélève un échantillon de taille n — 76 dans 
un lot qu’il vient de produire. La valeur indiquée par ces thermomètres plongés 
dans un liquide maintenu à la température constante de 16 degrés est considérée 
comme une va. X de loi normale dont l'écart type o est inconnu. Il désire effectuer 
le test entres les deux hypothèses suivantes : 

Hp: =1 

H; LG 2 
Pour un risque de première espèce à = 0,05, indiquer ce que sera sa conclusion pour 


des observations de températures telles que 3%, x; = 1140 et 3%, x? = 17195. 
Que se produit-il si on intervertit les deux hypothèses? 


Analyse de l'énoncé et conseils. Le rapport des vraisemblances fournit la forme de 
la région critique de ce test. Cette région est définie à l’aide d’une statistique dont la 
loi est connue sous l'hypothèse nulle, ce qui permet de déterminer le seuil critique en 
fonction du risque de première espèce a. 
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Paramètre d'une loi uniforme 


17. Un générateur de nombres au hasard est censé simuler une loi uniforme sur 
[0,1]. S'il est déréglé, il fournira une simulation d’une loi uniforme sur [0,6] avec 
0 = 1,1. S'il fournit les valeurs 0,95 ; 0,24; 0,83 ; 0,52 et 0,68 doit-on considérer qu'il 
est bien réglé? 


Analyse de l'énoncé et conseils. Le problème posé se ramène à un test sur la valeur 
du paramètre d’une loi uniforme sur [0,8], où les hypothèses confrontées sont 8 = 1 
et 0 = 1,1. Le rapport des vraisemblances n'étant pas défini partout, on construira 
la région critique sans référence au théorème de Neyman et Pearson en utilisant un 
estimateur du paramètre 6. 


18. La va. X suivant une loi uniforme sur [8,20], donner la région critique et la 
puissance du test de risque de première espèce « entre les hypothèses suivantes : 


H:0=1 
H; :0—0,9 


Peut-on en déduire la région critique du test suivant : 


H :0=1 
H,:0<1 


Analyse de l'énoncé et conseils. Il n’est pas question de déterminer ici un estimateur 
efficace puisque l’ensemble des valeurs possibles pour la variable dépend du paramètre 
à estimer. Cependant, entre les différents estimateurs sans biais possibles pour 6, obte- 
nus par la méthode des moments ou à partir des valeurs extrêmes m, = min{X1,...,Xu} 
et M, = max{X1,...,X,} de l'échantillon (X1,...,X,) de X, on fait le choix de celui qui 
est le plus efficace. On admettra qu'il s’agit de l’estimateur T; = (n +1)M,/ (2n +1). 
On construira donc la région critique à partir de cet estimateur dont la loi est connue 
sous Ho. 


Hypothèse multiple pour une proportion 


19. Sur un échantillon de 900 naissances, on constate qu'il y a 470 garçons. Un 
généticien décide d'utiliser ces données pour effectuer le test suivant relatif aux 
proportions p et 1 — p de naissances respectivement masculines et féminines : 


Ho : p = 0,50 
Hi : p = 0,48 


Quelle est la conclusion, au vu de cet échantillon, et pourquoi est-ce peu satisfai- 
sant? 
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Quelle est la conclusion retenue si on effectue le test suivant : 


Ho : p = 0,5 
H:p#£05 


Analyse de l'énoncé et conseils. On procède comme dans l'exercice 4, page 127, en 
utilisant la loi limite pour déterminer la région critique, ce qui se justifie par la taille 
élevée de l'échantillon. Le calcul de la puissance permet d'apprécier la qualité de ce 
test. On retient ensuite comme alternative p = p1 en étudiant successivement les cas 
pi > 05 et p1 < 0,5 pour en déduire la région critique du test d’alternative p %Æ 0,5. 


Hypothèses multiples pour la moyenne d'une loi normale 


20. Un fabricant de conserves de petis pois produit des boîtes où l'étiquette 
annonce un poids net égoutté de 5608. Il prélève un lot de 200 boîtes pour 
s'assurer qu'il n'aura pas d’ennuis à l'issue d’un contrôle éventuel. Formaliser 
le problème de test et indiquer s’il existe un test UPF. Pour un risque de première 
espèce retenu à = 0,01 quelle sera sa conclusion pour des observations (x1,...,X) 
telles que 37% x; = 111 140 et 37% (x; — #)? = 17959,75? Peut-on déterminer la 
fonction puissance de ce test si le procédé de fabrication est tel que sa précision est 
caractérisée par un écart type connu © = 10? 


Analyse de l'énoncé et conseils. On pourra considérer le poids net égoutté comme 
une va. de loi normale dont les paramètres m1 et o sont inconnus, l'étiquette annonçant 
que m = 560 qui sera donc l'hypothèse privilégiée par le fabricant. Il aura des ennuis 
seulement si le poids est inférieur à cette valeur annoncée, donc l'hypothèse alternative 
est m < 560. On résout d’abord le test entre deux hypothèses simples 5 = m9 contre 
m = mm avec mo = 560 et m1 qui est une valeur quelconque, inférieure à 560. Si la 
région critique obtenue par la méthode de Neyman et Pearson est indépendante de 
la valeur #1, ce sera celle du test le plus puissant contre l'alternative m < 560. Sans 
hypothèse supplémentaire, on ne peut pas déterminer la fonction puissance puisque le 
seuil critique dépend d’une statistique. Pour cela nous allons tester l’autre hypothèse 
o = 10 et, si elle est acceptée, on calculera la fonction puissance en faisant comme si 
l'écart type était connu. 


21. Un industriel produit des pièces dont la caractéristique principale peut être 
considérée comme une va. X de loi normale, de moyenne m = 1 et d'écart type 
o = 1.11 prélève au hasard 25 pièces qui ont été produites, pour tester si le réglage de 
la machine est toujours à m = 1. Sachant que la précision est toujours caractérisée 
par o = 1, indiquer les trois tests que l’on peut envisager pour contrôler un 
déréglement éventuel et représenter leur fonction puissance pour un risque de 
première espèce à = 0,05. Préciser à chaque fois la décision qui sera prise pour un 
échantillon où on a observé 3%, x; = 30,25. 
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Analyse de l'énoncé et conseils. Pour savoir si la machine est déréglée, on effectue 
un test dont l'hypothèse nulle est "m = 1, car c’est bien entendu l'hypothèse qui est 
privilégiée. L'hypothèse alternative sera une hypothèse multiple, différente selon que 
l’on a ou non des informations supplémentaires sur la nature du déréglement. Si l’on 
pense 4 priori que la valeur de réglage a été augmentée, l'alternative sera m > 1; elle 
sera m < 1 si l’on pense qu’elle a diminué et on retiendra m 1 sans information 4 
priori. Pour déterminer la région critique des deux premiers tests, on se place d’abord 
dans le cas d’une hypothèse alternative simple, conforme à l'hypothèse multiple (voir 
exercice précédent) ; pour le troisième test on retiendra l'union des régions critiques 
des deux précédents. 


Comparaison de proportions 


22. Un sondage effectué auprès de 2000 personnes indique que 19% d’entre 
elles connaissent la marque de lessive Omopaic. Après une campagne publici- 
taire, un sondage analogue auprès de 1000 personnes montre que 230 d’entre 
elles connaissent cette marque. Peut-on considérer que cette campagne a été 
efficace ? 


Analyse de l'énoncé et conseils. Il faut associer deux variables de Bernoulli, indica- 
trices de notoriété de cette marque de lessive, avant et après la campagne et faire un test 
de comparaison entre les paramètres de ces deux lois. L'hypothèse nulle est l'égalité de 
ces paramètres, l'alternative correspond à une valeur plus grande après la campagne. 
On utilisera la loi approchée de l’estimateur de la différence de ces deux paramètres 
pour construire la région critique. 


Comparaison d'échantillons 


23. Pour comparer deux marques d’ampoules électriques, on a effectué des essais 
sur des échantillons prélevés au hasard. La durée de vie moyenne observée sur 
un échantillon de 25 ampoules de la marque 1 est de 1012 heures, avec un écart 
type empirique de 241 h. Sur un échantillon de 13 ampoules de la marque 2, on a 
obtenu respectivement 1 104h et 319 h. Peut-on considérer que ces marques sont 
de qualités équivalentes ? 


Analyse de l'énoncé et conseils. Nous ferons l'hypothèse que les durées de vie des 
ampoules des marques 1 et 2 sont des v.a. X et Y de lois normales et l'hypothèse nulle 
correspond à l'égalité des moyennes de ces deux lois. Les tailles d’échantillon sont trop 
faibles pour pouvoir faire des approximations de loi; donc, pour effectuer ce test, il 
faut au préalable tester l'égalité des variances de ces deux lois. Si cette hypothèse est 
acceptée, on pourra réaliser le test de l'égalité des moyennes de deux lois normales de 
même écart type, car la loi de la statistique de test dans ce cas sera connue. 
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Test d'indépendance 


24. Le chef d'établissement d’un grand lycée parisien désire comparer les taux 
de succès au baccalauréat des trois sections générales. Les statistiques de l’année 
précédente figurent dans le tableau suivant : 


IL, ES S Total 
Réussite 41 59 54 154 
Échec D 36 75 132 
Total 62 95 129 286 


Au vu de ce tableau, peut-on considérer que les taux de réusssite sont indépendants 
de la section du baccalauréat? 


Analyse de l'énoncé et conseils. Pour répondre à cette question, il faut utiliser 
le test d'indépendance du khi-deux. On remplit donc le tableau qui serait obtenu 
dans l'hypothèse nulle à tester d'indépendance des deux caractéristiques, réussite au 
baccalauréat et section choisie, puis on calcule la distance du khi-deux entre ces deux 
tableaux. 


Tests d'adéquation 


25. Pendant 200 minutes, on note toutes les minutes le nombre de voitures qui 
ont franchi un poste de péage sur l'autoroute, ce qui donne la distribution observée 
ci-après : 


Nombre de voitures 0 1 D 3 4 E 6 7 & © Aù M 


Effectif observé 1 15 SÙ 46 Si 0 16 1 5 S 2 À 


Déterminer la loi théorique que l’on pourrait retenir pour modéliser ce phénomène 
d’arrivées par minute à un péage. 


Analyse de l'énoncé et conseils. Parmi les lois usuelles, c’est la loi de Poisson 
qui paraît convenir pour modéliser ces arrivées au poste de péage. Il faut estimer 
le paramètre de cette loi et ensuite tester son adéquation à la loi observée, en étant 
attentif au nombre de degrés de liberté de la loi utilisée et aux effectifs de classes. 


26. À la sortie d’une chaîne de fabrication, on contrôle toutes les trente minutes 
le nombre de pièces défectueuses contenues dans un lot de vingt pièces produites. 
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Les résultats observés sur 200 lots indépendants sont résumés dans le tableau 
suivant : 


Nombre de défectueux 0 il 2) 3 4 5 6 7 
Nombre de lots 26 52] 56 40 20 2 0 4 


Quelle loi théorique du nombre de défectueux par lot de vingt peut-on retenir au 
vu de ces observations? 


Analyse de l'énoncé et conseils. Il s’agit de tester l'adéquation de cette distribution 
empirique à une distribution théorique qui n’est pas donnée ici. Cependant, le nombre 
de défectueux dans un lot de 20 pièces produites suit une loi binômiale de paramètres 
n = 20 et p qui représente la probabilité qu'une pièce soit défectueuse (c’est-à-dire 
la proportion de pièces défectueuses fabriquées par cette chaîne). Comme l'un des 
paramètres de cette loi n’est pas fixé, il faudra l’estimer et en tenir compte pour le 
nombre de degrés de liberté de la loi asymptotique de la statistique utilisée dans ce test. 


SOLUTIONS 
€. 


€ 


À > Vrai. Si l'hypothèse nulle est privilégiée dans la méthode de Bayes par une 
valeur forte de po, elle doit donc être rejetée avec un risque très faible d'erreur 
qui est justement le risque de première espèce à dans la méthode de Neyman et 
Pearson. 


2 » Faux. Le principe de la méthode de Neyman et Pearson consiste au contraire à 
faire jouer des rôles dissymétriques aux deux hypothèses, l'hypothèse nulle étant 
a priori celle qui paraît la plus vraisemblable. Il faut donc des contre-preuves fortes 
pour la rejeter. 


3 > Vrai. L'erreur la plus grave consistant à rejeter à tort l'hypothèse nulle avec 
une probabilité «, il serait contraire à l'esprit de la méthode de Neyman et Pearson 
que l’autre erreur ait une probabilité 6 plus faible. 


4 > Faux. Dans le cas de deux hypothèses simples et sans information a priori 
l'affirmation est vraie. Mais si une seule des hypothèses est simple, c’est celle que 
l'on doit retenir comme hypothèse nulle pour que l’on puisse construire la région 
critique de risque de première espèce fixé à une valeur donnée «. 
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5 > Vrai. Si on retient comme définition d’une hypothèse simple celle qui est 
fournie dans les rappels de cours, la loi de X est totalement spécifiée sous l’alter- 
native H: et le calcul de la puissance est donc possible. Par contre, si on retient 
la définition plus généralement admise où une hypothèse simple correspond au 
cas où le paramètre 0 ne peut prendre qu'une seule valeur, cette affirmation peut 
devenir erronée. Si nous prenons l'exemple d’une va. X qui suit une loi normale 
d'écart type inconnu et que le test porte sur la moyenne, soit H6 : m = mo contre 
m = nm, la loi sous Hi n’est pas totalement déterminée car elle dépend de deux 
paramètres, et il n’est donc pas possible de calculer la puissance. 


6 > Faux. Dans le cas d’une loi discrète, les valeurs du risque de première espèce ne 
varient pas de façon continue et ne comporteront pas en général la valeur exacte a. 


7 » Vrai. La région critique étant construite à partir de l'hypothèse nulle, l’inver- 
sion des hypothèses peut conduire à des conclusions inverses, pour le même 
échantillon, si on intervertit les deux hypothèses. 


8 > L'expression de la vraisemblance est : 


n 7 ne. 

Ai NA % 
LG,..min = [fer ze" — 
: xl 
i=1 


Le rapport des vraisemblances, Li sous Ho, et L1 sous Hi, s'écrit donc : 
Lo = eZ") xi 
L 
Le théorème de Neyman et Pearson, qui permet d'obtenir le test de puissance 
“se À ; _ 
maximum, définit la région critique par la condition - < k, qui est donc ici 


1 
équivalente à : 


n 
) Xi < C 
i=1 


La valeur du seuil C qui définit cette région critique W est déterminée par la 
condition : 


a = P(WIHo) = P DE eCh= à 
i=1 
avec } *_, X; qui suit une loi de Poisson de paramètre 2n. Pour n = 9, on lit dans 
les tables de la loi de Poisson # (18) les probabilités P (a X; < 10) = 0,030 4 et 


P er X; < 11) = 0,0549. Comme la loi est discrète, on constate donc que l'on 


ne peut pas trouver un test de niveau exact à = 0,05. Si on retient comme région 
critique l’ensemble des points (x1,...,x9) tels que : 


9 
7. x; < 10 
i=1 
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on obtiendra un test de risque de première espèce inférieur à 5 %. Si on tient abso- 
lument à avoir un test de risque exact à = 0,05, il faut construire ce qu’on appelle 
un test mixte. Pour cela on procède de la façon suivante. Pour des observations 
telles que > Ÿ_, x; < 10, on rejette l'hypothèse nulle. Dans le cas où 3 Ÿ_, x; = 11,on 
effectue un tirage au sort où on rejette l'hypothèse Hÿ avec une probabilité y (on 
l’accepte donc avec une probabilité 1 — y). Le test sera bien de risque exact à = 0,05 
si on choisit y tel que : 


9 9 
a = 0,05 = P DE < 10] = à +yP DE = IX = d = 0,0304 + 0,0245y 


i=1 i=1 


196 
245 


9 > L'expression de la statistique de test est : 


k In V2 
D = [3 CR 1] 


ui PF 


soit y = 0,8. 


Pour un échantillon de taille N où la distribution empirique est caractérisée par les 
mêmes valeurs n;/n, la statistique associée aura pour valeur : 


k 


ND 
Da= | 3 CP 


a 


Dans le cas où N = 10n, on aura donc Dy = 10D,, soit pour les valeurs données 
Di000 = 21 qui est supérieur au seuil 16,9, ce qui conduit à rejeter l'adéquation à la 
loi uniforme. Pour une taille d’échantillon plus élevée, la valeur de la statistique 
augmente et la distribution empirique obtenue doit donc être plus proche de la 
distribution théorique pour qu'on accepte l'adéquation. 


10 > Le coût de la décision Do de prendre la garantie est de 300 F et le coût moyen 
associé à la décision D; de ne pas la prendre est de 2500p, car p qui représente 
la probabilité de panne est aussi la valeur moyenne de la variable indicatrice de 
panne définie par : 


1 sipanne (p) 
X — 
0 sinon (1-p) 


Les renseignements sur la provenance du téléviseur se traduisent par les probabi- 
lités a priori 0,8 et 0,2 affectées aux deux valeurs possibles de p qui sont p = 0,15 et 
p = 0,05. Tout ceci est résumé dans le tableau de coûts suivant : 


Do Di prob. a priori 
ls p= 05 300 375 0,8 
Hi : p= 0,05 300 125 0,2 
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La vraisemblance de l'échantillon (X1,...,X,) de cette loi de Bernoulli s'écrit : 
N IN x 
L (x, rs p) = pri (1 _ D De 


avec x; € {0,1}, 1 < i < n. On note Lo la vraisemblance pour p = 0,15 et L1 pour 
p = 0,05. Les espérances a posteriori des coûts sont : 


E[C(Do)] = 30070 + 300m1 et E[C(D:)] = 37570 + 1257 
La règle de Bayes conduit à prendre la garantie si E[C (Do)] < E[C (D:)] soit: 


1757 < 7570 7 x 0,2 x Li <3 X 0,8 x L > 7Li < 121 
20 20 
19 19 12 
= (ns+n%) 2% -20m5-n<— ES > 1,39 
Les x; ne prenant que des valeurs entières, on décide de prendre la garantie pour 
des observations telles que 3 °°, x; > 2, ce qui est le cas pour cet échantillon. 


Pour un coût de garantie de 350F, la relation E [C (Do)] < E[C (D:)] est vraie pour 
22571 < 2570, soit 9 x 0,2 x Li < 0,8 x Lo, ce qui est équivalent à : 


19 2 19 9 20 20 
(ns+m) 2.5 > 20m +inz = 2% = 251 2. 28 


et cette fois on ne prend donc pas la garantie. 


11 » Les données fournies conduisent à affecter les probabilités a priori 0,75 et 
0,25 aux deux valeurs possibles À = 1 et À = 3 du paramètre de cette loi de 
Poisson. Le nombre annuel moyen de pannes pour cette loi est E(X) = x. Si on 
prend la décision D, de ne pas souscrire de contrat d'entretien, cela correspond 
aux coûts moyens pour chaque hypothèse de 1 000 F et 3x1 000 = 3 000F. Tout cela 
est résumé dans le tableau de coûts suivant : 


Do Di prob. a priori 
Es Ni 1000 2400 0,75 
Fhsh=d 3 000 2400 0,25 


Les espérances a posteriori des coûts sont : 
E[C (Do)] = 100070 + 30007 et E[C(Di)] = 240070 + 24007: 


La règle de Bayes conduit à ne pas souscrire le contrat d'entretien si E[C (Do)] < 
E[C (D:)] soit : 


60071 < 140070 > 3 x 0,25 x Li <7 xX 0,75 x b = Li <7L 
La vraisemblance de l'échantillon de la loi de Poisson s'écrit : 


5 
L (x1,. 1% ; À) = eat /TTx: 


i=1 
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L'inégalité précédente est donc équivalente, en prenant les logarithmes, à : 


5 5 5 
D In3 <10+n7 = x <1087 = x < 10 


i=1 i=1 i=1 


puisque les x; ne prennent que des valeurs entières. L'observation 37, x; = 9 
conduit donc à ne pas souscrire le contrat d'entretien. 


12 » Dans l'optique de Bayes, les hypothèses m = 0 et m = 2 ont la même 
probabilité a priori 1/2. La décision D, de ne pas lancer la campagne a un coût 
nul. La décision D d'entreprendre cette campagne a un coût de 0,5 diminué d’un 
bénéfice moyen de 2, dans le cas où la campagne a été efficace. Ce qui conduit au 
tableau des coûts suivant : 


Do Di prob. a priori 
la} 8 4e = 0 0,5 0,5 
Eh ste 2? 0 —=i;5 0,5 


Les espérances 4 posteriori des coûts sont E [C (Do)] = 0etE[C (D:)] = 0,5%0—1,5m1 ; 
donc on aura E[C (Do)] < E[C(D1)] si xo > 3m, soit Lo > 8L:1. L'accroissement de 
bénéfices par ville est une va. X de loi N (m,2) soit une vraisemblance : 


5 

1 1 
L(X1,...,Xn 3 M) = ——> exp À ——- x; — m)? 
RS 


En prenant les logarithmes, la dernière inégalité est équivalente à : 
LS - cu 2] > M3 S. <5-—21n3 = 2,80 
8 1 L Î — À 
i=l i=l 


L'observation  . x; = 4 conduit donc à lancer la campagne publicitaire si on 
adopte cette règle de décision de Bayes. 


Dans l'optique de Neyman-Pearson, l'hypothèse nulle à ne pas rejeter à tort est 
celle d'une campagne qui serait efficace, ce qui correspond à l'hypothèse simple 
Ho : m = 2. L'hypothèse alternative est alors H1 : m = 0. Le théorème de Neyman 
et Pearson définit la forme de la région critique par Lo/L1 < k, soit ici en prenant 
les logarithmes : 


5 5 
1 2,2 
32 ls -2 | <k Le <C 
la valeur de la constante C étant déterminée par le risque de première espèce 
ù—P ( X; < C\m = 2). Sous l'hypothèse nulle, la moyenne empirique X5 suit 
une loi normale N (. 2/ V5) ; donc C est défini par : 


+ X5—2 _ C/5-2 
[2/5 2/5 
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soit C = 10 + 245 où u est le fractile d'ordre a de la loi normale centrée-réduite. 
Pour un risque à = 0,05, on a u = —1,6449 et C = 2,64; donc la règle de Neyman 
conduit à accepter l'hypothèse nulle, c'est-à-dire à lancer la campagne. Par contre, 
pour un risque de première espèce plus élevé « = 0,10, on lit dans la table 2, 
page 195, le fractile u = —1,281 6, d'où C = 4,27. L'observation x; = 4 conduit 
cette fois à ne pas lancer la campagne. 


Le changement de nm = 2 en m > 0 oblige à retenir l'hypothèse simple m = 0 
comme hypothèse nulle du test de Neyman-Pearson. La région critique Lo/L1 < Kk 
est cette fois définie par : 


L 


5 5 
Lx — Gi m)] < ki nn D D > C 
" 1 


où la constante C est déterminée par la condition à = P ( X; > Cm = 0). On 


obtient cette fois C = 2u5, où u est le fractile d'ordre 1 — à de la loi normale 
centrée-réduite. Pour un risque à = 0,10, le fractile est u = 1,2816 et C = 5,73; 
donc même avec ce risque de première espèce élevé on décide de ne pas lancer la 
campagne. Le changement d’hypothèse nulle, dû à des raisons techniques, amène 
à ne la rejeter que pour des très grandes valeurs observées d'augmentation de 
bénéfices, même si on choisit un risque a élevé. 


13 > a) Choisirp = 0,48 comme hypothèse nulle, au lieu de p — 0,52, c'est vouloir 
se prémunir avant tout contre le risque de conclure à son élection, en acceptant 
l'hypothèse p = 52% alors qu’en fait on aurait p = 48%. Ce candidat préfère 
être agréablement surpris, plutôt que d'entretenir un faux espoir. On introduit ici 
des variables de Bernoulli associées à chaque électeur interrogé i, 1 < i < n, qui 
prennent la valeur 1 quand celui-ci déclare son intention de vote pour le candidat 
D. Magog : 


a 
0 1-p 


La vraisemblance de l'échantillon (X:1,...,X,) de cette loi de Bernoulli s'écrit : 
n 
Laruns) = [[r" (tp) = pans (ES 
i=1 


avec x; € {0,1}, 1 < i < n. On note Lo la vraisemblance pour p = 0,48 = po et Li 
pour p = 0,52 = p1. Le rapport des vraisemblances s'écrit : 


Lo _ (y ( nm) 
Li pi l—p 


La région critique est définie par le théorème de Neyman et Pearson, après avoir 
pris les logarithmes, par l'inégalité : 


n po n 1—po 
xim—+|n— x | ——— <nk 
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qui est équivalente à : 


Fos 
In — : Xi < k 
( nm nn) . 


Comme po < p1 et 1 — pi < 1 — po, on obtient la condition D, x; > k:. On peut 
définir également la région critique à l’aide de la moyenne empirique, qui est un 
estimateur sans biais du paramètre à tester p et dont on pourra déterminer la loi 
asymptotique. C'est l’ensemble des points (x1,...,x,) tels que : 


Xr > C 


La valeur de la constante C, qui est le seuil critique de ce test, est définie à partir 
du risque de première espèce, soit : 


a = P(X, > Cip = 0,48) 


Si on utilise la loi asymptotique, déduite du théorème central limite, la va. X, 
suit approximativement une loi normale d'espérance p, et de variance pogo/n avec 
go = 1 — po. On obtient donc une valeur approchée de C par la condition : 


=plirs _C= po 
VPogo/n 
où U est une v.a. de loi N (0,1). Ainsi, u désignant le fractile d'ordre 1 — à de cette 
loi, la région critique est définie par la condition : 


E > po+u — 


Pour à = 0,10 on lit dans la table 2, page 195, le fractile u = 1,2816 et le seuil 
critique pour n = 100 est alors C = 0,48 + 1,281 6/20 = 0,544. En dépit d’un risque 
de rejet de l'hypothèse nulle assez élevé puisque à = 10%, on ne rejette l'hypothèse 
p = 48 % que si plus de 544% des personnes interrogées déclarent vouloir voter 
pour ce candidat, valeur bien supérieure à p1 = 52%. Ceci s'explique par une 
taille d’échantillon trop faible pour séparer deux hypothèses voisines de 50 %. La 
puissance de ce test se calcule par : 


= Pix = cp=n) seu un 


/pig1/n 


Les valeurs de po et p1 étant proches de 1/2, on peut remplacer C par po + u/2Vn 
et on calcule alors une valeur approchée de la puissance par la probabilité : 


= P{U > u+ (po pr) 2V) 


ou n = 1 — ® (u — 0,08,/n), ® désignant la fr. de la loi N (0,1). Pour n = 100, on 
obtient n = 0,544, soit un risque de seconde espèce élevé B = 0,456. Le risque de 
première espèce étant fixé, la puissance augmentera si la région critique s'agrandit, 
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c'est-à-dire si le seuil C diminue, ce qui se produira en augmentant la taille de 
l'échantillon. Le tableau suivant fournit les différents seuils et puissances pour les 
tailles d’échantillon proposées : 


n 100 500 1 000 
CE 0,544 0,509 0,5003 
n 0,544 0,695 0,894 


b) La région critique, de ce test est définie par : 
X > 0,49 + u/2/n 


Sa puissance est calculée approximativement par n = 1 — ® (u — 0,044/n). Pour 
que cette puissance soit supérieure à 0,90, il faut que la taille d’échantillon vérifie 
1,2816 — 0,04/n < —1,2816, soit /n - 64,08 ou n > 4107. Pour cette valeur 
élevée de n, on obtient l'égalité des risques à = 8 — 0,10 et un seuil critique 
C = 0,50 à équidistance des deux hypothèses. Il faut donc environ quatre fois plus 
d'observations que pour le test précédent afin de séparer ces deux hypothèses, 
encore plus proches, avec les mêmes risques. 


14 » La vraisemblance s'écrit : 


L( ) : - ; (xi — m)? 
Lle.ss y ne à M) = EXP À — — Xi — 
: oV27 P 20? ï 


La forme de la région critique, donnée par le théorème de Neyman et Pearson, est 
Lo/L1 < K, ce qui en passant aux logarithmes conduit à l'inégalité : 


1 n 
5) [&-2-&-3]<Imx 
i=1 
Elle est équivalente, après développement du crochet, à : 


25 % + 5n < 26°Ink 


i=1 


Pour l'instant, on cherche seulement à déterminer la forme de la région critique et 
l'expression des constantes qui apparaissent dans cette inégalité est sans intérêt. 
On remplace donc cette inégalité par D ,x; > k, qui lui est équivalente. La 
région critique est donc définie à partir de la valeur de la somme des observations. 
Cependant, comme c’est la loi de la moyenne empirique X, qui est connue, il est 
préférable de faire intervenir cette moyenne dans la définition de la région critique 
W, qui sera donc l’ensemble des points (x1,...,x,) tels que : 


Xn > C 


Il reste à préciser la valeur de cette constante C, qui sera le seuil de cette région, 
à partir du risque de première espèce a qui est fixé. Il représente la probabilité de 
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cette région, lorsque l'hypothèse nulle est réalisée, et par conséquent, la condition 
qui définit C s'écrit : 


a = P(Wim = 2) = P(X, > CIm = 2) 


Sous Ho, la moyenne empirique X, suit la loi N (2, 2/ Vn), donc en centrant et 
réduisant on obtient la condition : 


où U est une v.a. de loi N (0,1). Ainsi la constante C est définie par : 
u 
C=2+2— 
+2 


où u est le fractile d'ordre 1 — à de la loi N (0,1). Pour un risque à = 0,05, on lit 
dans la table 2, page 195, le fractile # = 1,6449, d'où une région critique définie 
pour n = 100 par: 


W= {(x1,...,%100) /X100 > 2,33} 


Dans ce cas, la puissance du test est la probabilité de cette région dans l'hypothèse 
alternative, soit : 


: 2,333 
n= PK > 2,381 = 3 =P(uz à }= 056 
Goo ) 2/ VT00 


On obtient ainsi un risque de seconde espèce de valeur B = 0,004 très inférieure à 
celle du risque de première espèce, ce qui est contraire à l'optique de Neyman et 
Pearson qui a permis de bâtir ce test. Si on veut que, plus logiquement, 6 > 0, il faut 
choisir une valeur plus faible pour à. Si on retient par exemple à = 0,001, le fractile 
d'ordre 0,999 est u = 3,090 2, soit C = 2,62. La puissance est alors n = 0,9719, donc 
B — 0,028 1 est bien cette fois supérieur à a, ce qui est plus cohérent. 


Pour un risque «à = 0,05, la condition n > 0,95 conduit à choisir une taille 
d'échantillon n telle que : 


n= PR, 22+2im 3 _pluzu- V1) >005 
Ji 2 


ce qui est équivalent 1,6449—,/n/2 < —1,6449, soit /n > 6,6, donc une taille 
d'échantillon supérieure à 9 = 44 pour laquelle on aura 8 = 0,05 = à avec 
C = 2,5 seuil équidistant des deux hypothèses. Si on choisit une taille d’échantillon 
supérieure à no, ce qui était le cas ici, le risque B diminue et devient inférieur à 
a — 0,05, ce qui est contraire à l'optique dans laquelle a été construit ce test. La 
condition n > 0,99 impose de choisir n tel que cette fois 1,6449 — /n/2 < —2,3263, 
soit n > 64. On avait d’ailleurs obtenu n = 0,9% pour n = 100. 
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15 » La méthode de Neyman et Pearson conduit à la même région critique que 
dans l'exercice précédent. Mais cette fois il n’est pas possible de déterminer le 
seuil C car la loi de X, dépend du paramètre inconnu 6. On fait donc intervenir 


. _ 5. A5 . : 
l’estimateur sans biais 52 — 1 (Xi —X;) de la variance o? et la variable 
n 


— 1 
centrée et réduite /n (X, — m) /o est remplacée par la statistique /7 (X, — m) /S: 
qui suit une loi de Student à n — 1 degrés de liberté. La région critique W est donc 
l’ensemble des points (x1,...,x,) tels que : 


Xn — 1 
Vn mt C 
Sn 
où la valeur du seuil C est déterminée par la condition : 
K: — 
rl er = cm= 1] 
n 


c'est-à-dire que C est le fractile d'ordre 1 — « de la loi de Student à #7 — 1 degrés de 
liberté. Pour un risque à = 0,05 et n = 25, on lit dans la table 6 le fractile C = 1,711, 
d’où une région critique définie par : 


W={(%1,...,225) / X25 > 1 + 0,345} 


La puissance représente la probabilité de cette région dans l'hypothèse alternative, 
soit n = P{/n(X; — 1) /S1 > Cm =2} = P{/n(X-2) JS, = C— /n/S4}. La 
va. Vn(X; — 2) /S, suit une loi de Student à n — 1 degrés de liberté, mais on ne 
peut pas calculer cette probabilité car la borne de l'intervalle dépend de $, qui est 
une variable aléatoire. 


16 > Pour effectuer ce test, nous disposons d’un échantillon d’une loi normale 
d'espérance 16 et d'écart type o = 1 sous Ho et o = 2 sous Hi. Le rapport des 
vraisemblances a donc pour expression : 


Lo ñn 1 - D 1 - 2 n 3 - 2 
= op] 3 36-10 326 16) | =2"exp g 2 Gi —16 


La région critique est donc définie par le théorème de Neyman et Pearson comme 
l’ensemble des points (x1,...,x,) tels que : 


Du 167 2 C 


i=1 


où C est le fractile d'ordre 1 — à de la loi x2 suivie par 3", (X; — 16)? sous 
l'hypothèse nulle. Pour « = 0,05, on lit dans la table 5, page 199, par interpo- 
lation pour n = 76, la valeur C = 97. Les observations donnent X#, (x; — 16)? = 
17195 — 32 x 1 140 + 76 x 16? = 171, ce qui conduit à refuser l'hypothèse nulle 
o = 1. L'interversion des hypothèses change le sens de l'inégalité, la région critique 
étant définie par : 


167 < C 


i=1 
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Mais cette fois c’est la variable 3%, (X; — 16)° /4 qui suit une loi x2 sous Ho et 


c'est donc C/4 qui est le fractile d'ordre a de cette loi. Pour à = 0,05, on déduit 
de la table 5, page 199, par interpolation pour n = 76, la valeur C = 227. On 
refuse donc à nouveau l'hypothèse nulle, qui est cette fois o = 2. L'expression des 
deux régions critiques nous montre que pour toutes les observations telles que 
97 < +. (xi — 16)? < 227 l'interversion des hypothèses entraînera l’interversion 
des conclusions. Ceci s'explique par la remarque qu'il s’agit d’une région de 
probabilité très faible, quelle que soit l'hypothèse retenue, puisque : 


76 
Dee 16)? > 150|o = 1 = 0 


i=1 


et : 


76 
PS (X; — 16)? < 180lo = à = 0,0026 


i=1 


17 » Le paramètre 0 représentant la plus grande valeur possible de la variable X 
de loi uniforme sur [0,8], l’estimateur de 8 basé sur un n-échantillon de cette loi 
sera la plus grande valeur observée, soit M, = max{X;/1 < i < n}. Bien entendu, 
on rejettera l'hypothèse nulle H6 : 8 = 1 si on observe M, > 1. La forme de 
la région critique est donc M, > C, la valeur de C < 1 étant déterminée par 
a = P(M, > C|8 = 1) ou1—a = P(M, < CI0 = 1) = C', soit C = (1 — a)!/". Pour 
a = 0,05 et n = 5, on obtient C = 0,99 ; donc on accepte bien ici l'hypothèse 0 = 1. 


18 > La valeur du paramètre étant plus petite dans l’hypothèse alternative, on 
acceptera donc celle-ci pour les plus petites valeurs de l’estimateur, d’où une région 
critique de la forme T, < C, la valeur de C étant déterminée par : 


2n+1 
a = PT, < CR = 1) = P(M, < ik ce=1) 
n +1 


La loi de M, est obtenue par P (M, < x) = F"'(x) où F est la f:r. de la loi uniforme 
sur [0,20], définie par : 


0 si x<0 
F (x) = 1 si 0 < x < 26 
1 si 20 < x 


On obtient donc : 


Soit la région critique définie par : 


M, <1+a!/" 


© Dunod. La photocopie non autorisée est un délit. 


TD 8 e Théorie des tests 147 


La puissance de ce test se calcule par : 


1 1/n Lo 
= P(M, < 14016 09) = | re -1) 


0,9 


La région critique précédente étant indépendante de la valeur 8 = 61 dans 
l'hypothèse alternative, avec seulement la condition 0, < 1, est aussi celle du 
test d’alternative H1 : 8 < 1. Cependant, cette alternative étant une hypothèse 
multiple, on ne peut pas calculer la puissance de ce test. 


19 > On introduit ici une variable de Bernoulli, indicatrice d’une naissance mas- 
culine, de paramètre p. Nous avons vu dans l'exercice 4, page 127, que le rapport 
des vraisemblances conduit à une région critique définie par : 


po _. n 
In — + In —— x <k 
( pi 1— po > 


avec ici po = 0,50 et p1 = 0,48, donc de façon équivalente 37, x; < C. La constante 
Cest définie par : 


a=r[3x < ci | =P|x, < Elp=05| 


i=1 


On utilise la loi approchée de X,, qui est la loi normale de paramètres p = 0,5 et 
d'écart type /pq/n = 1/24/n. Donc, en centrant sur 1/2 et en réduisant, on obtient 
comme valeur approchée du seuil critique : 

nl Vn 

C=-+u— 

2 y 
où u est le fractile d'ordre «à de la loi N (0,1) et «à le risque de première espèce 
retenu. Pour à = 0,05, le fractile est = —1,6449, donc pour n = 900, on obtient 
C = 425, ce qui conduit ici à retenir l'hypothèse nulle p = 50%, ce qui paraît 
logique puisqu'on a observé 52% de naissances masculines dans cet échantillon. 
Cependant, le calcul de la puissance va permettre de juger de la qualité de ce test : 


3 H K C C/n — 0,48 
nr[x<a J-rfs<fnoa]srelu< RS 
i=1 


0,48 x 0,52/n 


soit ici comme valeur approchée D (—0,467) = 0,32 où ® est la f:r. de la loi N (0,1). 
Il y a donc 68 chances sur 100 d'accepter l'hypothèse p = 0,50 dans le cas où 
p = 0,48. Le risque de seconde espèce est très élevé. 


Suivant que p1 < 0,5 ou p1 > 0,5, la région critique sera de la forme x, < ki ou 
Xn > ko. On retient donc pour l'alternative p Æ 0,5 une région critique symétrique 
par rapport à l'hypothèse nulle, donc définie par : 


1% — 0,51 > C 


où C est définie par à = P(|X; —0,5| > C|Ho) donc de valeur approchée u/2/n 
où u est le fractile d'ordre 1 — «/2 de la loi N (0,1). Pour à = 0,05, on lit u = 1,9% et 
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C = 0,033. Pour l'observation %900 = 0,52, on retient à nouveau l'hypothèse p = 0,5. 
Cependant, l’autre risque d'erreur a pour expression : 


B = P (0,467 < X, < 0,533|p = 0,48) 


5 (ñ 0,467 048 | 0,533 — 0,48 ) 
L 0,48 * 0,52 0,48 * 0,52 


soit f = 0,78 valeur encore plus élevée que dans le test précédent. Il serait plus 
logique ici de retenir comme alternative p > 0,5, la région critique étant alors 
définie par 900 > 0,527 5. On accepterait encore l'hypothèse p = 0,5. 


20 > D'après ce qui a été obtenu dans l'exercice 6, page 128, la région critique du 
test entre les hypothèses : 


H, : m = 560 
H:m=m 


avec #1 < 560 est l’ensemble des points (x1,...,x,) tels que : 


= Xn — 560 <c 
Sn 
La constante C est définie par la condition : 
a = 


c'est-à-dire que c’est le fractile d'ordre à de la loi de Student à 199 degrés de 
liberté. Pour à = 0,01, on lit dans la table 6, page 200, le fractile C = —2,345. Pour 
cet échantillon, on obtient 4/200 (%200 — 560) /5200 = —6,40, valeur très inférieure 
au seuil critique; donc on rejette l'hypothèse nulle, bien que le risque à ait été 
choisi très faible. Comme la région critique est indépendante de la valeur de #1, 
pourvu que m1 < 560, ce test qui est de puissance maximum d’après le théorème 
de Neyman et Pearson est un test UPP pour l'alternative m < 560. On ne peut pas 
calculer sa puissance, qui est définie par : 


= x — = 


Sa 


En effet, si la loi de V/n(X, — m) /S, est connue, loi de Student à n — 1 degrés de 
liberté, la borne de l'intervalle dépend de $,, qui est une va. On va donc tester 
l'hypothèse o = 10, équivalente à o? = 100, contre l'alternative 0? 100. On utilise 
pour cela la variance empirique et la région d'acceptation de l'hypothèse nulle de 
ce test est de la forme : 


région de probabilité 1 — a. Donc a et b sont respectivement les fractiles d'ordre a/2 
et 1 — a/2 de la loi du khi-deux à n — 1 degrés de liberté. Pour n = 200, on utilise 
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l’approximation par la loi N (0,1) de la loi de V2Y — 2v — 1 avec Y de loi x? et 
ici u = n — 1. On obtient a = 150,49 et b = 253,14. Comme Y 7% (x; — #20)? /100 = 
179,60, on accepte l'hypothèse & = 10 et on est ramené à un problème de test de la 
moyenne d’une loi normale d'écart type connu. La région critique est alors définie 
par : 

Xn — 560 

= — EC 

Mer 

et Cest le fractile d'ordre a de la loi N (0,1). Pour à = 0,01, on lit C = —2,3263 et la 
région critique est définie par x, < 558,36. La fonction puissance est alors définie 
en fonction de #5 par : 


x, — 560 — 
Tics æ = [ V2 658,36 - m)| 


ph 
: LA 10 10 


où ® est la fr. de la loi N (0,1). 
21 > On effectue le test entre les hypothèses simples : 


Ho :m=Mm 
Him=m 


pour une va. X de loi N (m,0) avec l'écart type connu o = 1. Le théorème de 
Neyman et Pearson conduit à une région critique définie par : 


25 


Go —m) D x <k 


i=1 


La forme de la région critique de ce test, de puissance maximum, ne dépend pas 
de la valeur précise de #1, maïs de sa position par rapport à m0 = 1. Ainsi, pour le 
test de : 


H:m=i 
H:m>i 


toutes les valeurs de 5 correspondant à l'alternative sont supérieures à m9 ; donc 
la région critique du test précédent est toujours la même et on a obtenu un test 
UPP : 
Wi = {G,...,%25) / X5 > C} 
où C est défini par : 
a = P(WilHo) = P(X25 > Cm =1) = P{U > 5(C—1)}=1-d{5(C—1)} 
avec U va. de loi N(0,1), de fr. D. Le seuil de ce test est donc C = 1 + u/5, 


où u est le fractile d'ordre 1 — à de la loi N (0,1). Pour à = 0,05, on lit dans la 
table 2, page 195, le fractile u = 1,6449 et on obtient C = 1,33. Sur cet échantillon 
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on a observé %25 = 1,21; donc on accepte l'hypothèse nulle d’un bon réglage. La 
fonction puissance de ce test est définie par : 


ni Gn) = P(WilHi) = P(X55 > Cm > 1) 
=P{U>5(C-m)}=1-D{u-5(m—-1)} 


Pour le test de : 


H:m=1 
H:m<1 


on obtient aussi un test UPP de région critique : 
Wo = {(x1,...,%25) /X25 < C} 


avec toujours C = 1 + u/5, mais cette fois u étant le fractile d'ordre « de la loi 
N (0,1). Pour à = 0,05, on a donc u = —1,6449 et C = 0,67, l'hypothèse nulle étant 
bien sûr toujours acceptée. La fonction puissance de ce test est définie pour m < 1 


par : 
n2 (mn) = b{u+5(1-m)} 
Pour le test de : 


H:m=1 
H:imzl 


on ne peut pas cette fois déduire la forme de la région critique de celle du test entre 
les hypothèses simples, car elle dépend de la position inconnue de m par rapport 
à 1. On va retenir une région critique qui sera l’union des précédentes, c’est-à-dire 
définie par %25 > C1 ou 5 < C2, mais qui ne sera pas celle d’un test UPP. En raison 
de la symétrie de la statistique de test et de l'alternative, on retient comme région 
critique : 


W= {(x1,...,225) / |%25 — 1] > C} 
où C est définie par : 
a = P(WIHo) = P(|X25 — 1] > Clm = 1) = P(IUI > 5C) = 2[1 — d (5C)] 


Donc C = u/5 où u est le fractile d'ordre 1 — «/2 de la loi N (0,1). Pour à = 0,05, on 
litu = 1,96etC = 0,392, soit une région critique définie par %5 < 0,61 ou x»5 > 1,39 
et une nouvelle fois on accepte l'hypothèse nulle. La fonction puissance de ce test 
est définie pour 5m quelconque par : 


nn) =1-D{u+5(i-m)} + Db{5(1—m)—-u} 


Le graphe des trois fonctions puissances sur la figure 8.1, page ci-contre, montre 
bien que ce dernier n’est pas UPP puisque n1 (m) > n (m) pour m > 1 et n2 (m) > 
n (m) pour m < 1. 
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Figure 8.1 


22 » Les variables indicatrices de notoriété de la marque Omopaic sont X et Y 
respectivement avant et après la campagne, de paramètres p1 et p2. On dispose 
d'échantillons de ces deux lois, d'effectifs respectifs 71 = 2000 et n2 = 1 000, pour 
effectuer le test : 

Ho : Pi = p2 Ho : pi — p2 = 0 

Hi : pi < pr Hi : p1 — p2 <0 
Les moyennes empiriques X et Ÿ de ces deux échantillons permettent de définir 
l’estimateur sans biais X — Ÿ du paramètre à tester 0 = p1 — p2. Sa loi approchée 
est une loi normale d'espérance 8 et d'écart type inconnu © = /p1q1/11 + P2q2/n2 


où g1 = 1 — pi et g2 = 1 — po. Sous l'hypothèse nulle, on estime la valeur commune 
P = Pi = p2 par la réunion des deux échantillons : 


LL mX+MmY 1 _ Les 
ne LAN 
P Ni + M M + M D ! > j 


Cet estimateur permet aussi d'estimer dans ce cas l'écart type : 


= /p(1—p) A/m +1/m) 


On effectue alors le test à l’aide de la v.a. normalisée : 


X—Y 


QE 
P(1-P) (/m +1/m) 


dont on peut admettre, compte tenu des tailles d’échantillon élevées, qu'elle suit 
approximativement une loi normale standard dans l'hypothèse nulle. La région 
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critique est définie par 0 < C, où on retient comme valeur approchée de C le fractile 
d'ordre a de la loi N (0,1) pour un 1 risque de première espèce « fixé. Pour à = 0,05, 
la région critique est définie par 0 < —1,6449 et on obtient pour cet échantillon 


£= 0,19, ÿ = 0,23, P = 0,203, /P(1 — P) (1/m + 1/n2) = 0,0156 et Ô = —2,57, donc 


on accepte l'hypothèse de l'efficacité de la campagne. Pour un risque plus faible 
a = 0,01, le seuil critique est C = —2,33 et l'hypothèse nulle est encore rejetée. 


23 » Les durées de vie des ampoules des marques 1 et 2 sont respectivement les 
va. X et Y de lois respectives N (m1,01) et N (m2,02), ces quatre paramètres étant 
inconnus. Le test à effectuer est : 

Ho : Mi = M Ho : M — Mi = 0 

> 

Him £ mm Hi : M — m) Z0 
et utilise pour cela l’estimateur sans biais X — Ÿ de m1 — m2. Cet estimateur suit 
une loi normale centrée sous Ho, mais de variance inconnue o?/n1 + o2/n2, où m 


et m sont les effectifs des échantillons respectifs des lois de X et Y. On utilise donc 
les estimateurs sans biais de of et 0? qui sont respectivement : 


; 1 n] _—. : 1 n2 .. 
rm (X-X) et + mer 


Sion remplace l'écart type inconnu par sonestimateur ,/S?/n1 + S3/n2 pour réduire 


X — Ÿ, on n’obtiendra pas une loi de Student. Il faut pour cela que l'écart type des 
deux échantillons soit le même, donc on doit faire un test préalable d'égalité des 
variances : 


De 
or 
20 2 
Hi : 07 £ 05 


On accepte l'hypothèse nulle si le rapport 57/57 est voisin de 1, soit une région 
d'acceptation de la forme : 


Les valeurs des constantes 4 et b sont définies par : 


se Êe 
= =P|= <alH|=P|=>blH 
2 Ce Ce 


avec 57/52 qui suit une loi F (m1 — 1,n2 — 1) sous Ho. Pour à = 0,10, on lit dans 


[e] 


la table 7, page 201, le fractile a = = 0,46 et on obtient par interpolation 


2,18 
b = 2,50. La valeur calculée de 5?/$2 pour cet échantillon est 0,55, donc on accepte 
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l'égalité des variances. On retient alors comme estimateur sans biais de la variance 


commune 6? = 0? = 02 : 


_ Gun —1)S?+ (m —1)S$ 


S2 
Ni + HN — 2 


La région critique du test initial est alors définie par : 
IX = Y| 
—_————— > 
S/1/n1 + 1/n2 
où f est déterminé par : 
IX = Y| 
= P | —— > 1H 
S/1/n1 + 1/n2 


donc est le fractile d'ordre 1 — a/2 de la loi de Student à n1 + n2 — 2 degrés de 
liberté. Pour à = 0,05, on lit dans la table 6, page 200, le fractile { = 2,028. Pour cet 
échantillon, on observe 52 — 77 081,06 et : 

i—ÿ 92 


s/Tm+lm 249 


Donc on accepte l'égalité des moyennes de ces deux lois. 


—0,97 


24 » Dans l'hypothèse nulle d'indépendance des deux caractéristiques de ces 
candidats au baccalauréat, le tableau est obtenu à partir du produit des effectifs 


marginaux. Par exemple, le nombre d'étudiants ayant réussi en section L serait 


154 x 62 
dans ce cas — arrondi à 33 puisqu'il s’agit d'effectifs entiers. On aboutit 


ainsi au tableau suivant : 


IE, ES S Total 
Réussite 33 Gi 70 154 
Échec 29 44 59 132 
Total 62 95 129 286 


La région critique est de la forme D, > C où C a comme valeur approchée le fractile 
d'ordre 1 — a de la loi du khi-deux à deux degrés de liberté, pour un test de risque 
de première espèce «. Pour &« = 0,05, on lit dans la table 5, page 199, la valeur 
C = 5,991. La valeur de la statistique utilisée pour ce test est ici : 


41-33) (59-51) (54-70) 
_ 41-33) 69-51), 64-70) 
33 51 70 
21-29) (36—44) (75 — 59) 
PAL Lys Y à ( ) 
29 44 59 


D, 


soit D, = 14,85 ; donc on rejette l'hypothèse d'indépendance. 


154 TD Statistique et probabilités 


a 800 
25 > La moyenne empirique de cette distribution vaut 500 — 4, donc on teste 


l'adéquation à une loi de Poisson de paramètre À = 4. La table 4, page 198, 
nous permet de calculer les effectifs théoriques en multipliant les probabilités 
individuelles par 200 et en arrondissant. Par exemple pour x = 1, la probabilité 
vaut p1 = 00733, soit un effectif théorique np1 = 14,66 arrondi à 15. On obtient 
ainsi le tableau des deux distributions, empirique et théorique : 


Nombre de voitures 0 1 D 9 À 5 GG 7 & 9 io 
Effectif observé 1 15 4ù0 46 2 4 © 18 5 8 2 À 
Effectif théorique 4 15 2% © & al 2 12 6 8 1 € 


Les effectifs des valeurs extrêmes étant inférieurs à 5, on regroupe les deux pre- 
mières et les quatre dernières valeurs. Il reste donc seulement huit classes de valeurs 
et comme le paramètre de la loi théorique retenue a été estimé, la statistique qui 
définit la région critique D, > C suit approximativement une loi du khi-deux à six 
(8 — 1 — 1) degrés de liberté. Pour à = 0,05, le seuil critique est le fractile d'ordre 
0,95 de cette loi, soit C = 12,6. La valeur observée ici est : 


16—19)2 (30—29) 49 1 1 25 1 1 
RE OU Rd 


D, 
19 29 39 39 31 21 12 10 


donc on retient comme loi théorique la loi # (4) pour la va. X qui représente le 
nombre de voitures qui arrivent par minute à ce poste de péage. 


26 » Si on considère que le nombre de défectueux est une v.a. X de loi binômiale 
8 (20,p), on estime le paramètre p à partir de la moyenne empirique %200 = 2,01 et 
on retient p = 0,1. Les probabilités individuelles p; lues dans la table 3, page 197, 
de la loi binômiale 8 (20 ; 0,1) permettent de calculer les effectifs théoriques npi, 
arrondis en valeurs entières. Par exemple, pour la valeur x = 0, on lit po = 0,1216, 
soit po = 24,32 arrondi à 24. On obtient ainsi le tableau des deux distributions, 
empirique et théorique : 


Nombre de défectueux 0 1 2) 4 4 5 6 7 
Nombre de lots 26 52 56 40 20 ? 0 4 
Effectif théorique 24 54 57 38 18 6 2 1 


On regroupe les trois dernières valeurs pour obtenir un effectif théorique supérieur 
à cinq. La région critique est de la forme D, > C. La loi asymptotique de la 
statistique D, est une loi du khi-deux à quatre degrés de liberté car il y six classes 
de valeurs distinctes retenues et un paramètre estimé. Pour à = 0,05, la valeur de 
C est le fractile d’ordre 0,95 de la loi x soit C = 9,5. La valeur observée ici est : 


26—24ÿ (52—54ÿ 1 4 4 9 
= + Stats to — 159 


D, 
24 54 57 38 18 
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Donc on accepte comme loi théorique la loi binômiale 8 (20 ; 0,1). Pour «à = 0,10, 
la conclusion serait identique puisque le seuil serait C = 7,8. 


La valeur retenue pour p étant ici très faible, on pourrait aussi considérer que 
la présence d’une pièce défectueuse est un événement rare susceptible d’être 
modélisé par la loi de Poisson. La variance empirique a pour valeur 1,98 très 
proche de celle 2,01 de la moyenne empirique, ce qui conforte cette possibilité. On 
va donc calculer les effectifs théoriques associés à une loi de Poisson ® (2) : 


Nombre de défectueux 0 1 D 3 4 5 6 7 


Nombre de lots 26 52 56 40 20 À 0 4 
Effectif théorique 27 54 54 36 18 7 2 2 
On regroupe encore les trois dernières valeurs et on obtient D, = 3,13, valeur un 


peu plus élevée que dans le cas de la loi binômiale, mais on peut également retenir 
cette loi théorique. 
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Annales corrigées 
+ Université 
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1 SUJETS D'EXAMEN 


LICENCE ÉCONOMIE ET GESTION, 2° ANNÉE 


Septembre 2007 


T. Deux événements A et B ont comme probabilités respectives 1/4 et 1/3 de se 


réaliser seuls (l’un et pas l’autre). Sachant que la probabilité que l’un ou l’autre se 
réalise est de 3/4, préciser s'ils sont indépendants ou non. 


2: Quatre joueurs À, B, C et D tirent successivement et sans remise une carte d’un 


lot de 6 cartes numérotées de 1 à 6. Si un joueur tire une carte paire, il a gagné et 
le jeu s'arrête. 


a) Calculer la probabilité de gain de chaque joueur. 


b) Soit N la va. qui représente le nombre de tirages effectués à l'issue de ce jeu. 
Calculer E (N). 


1 1 
3. La loi d’une va. X est définie parP(X=n) = “ri pour tout entier n > 1. 


Calculer P(X < n) pour tout entier 1, puis E (X). 
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4. a) Soit X une va. de loi normale, telle que P(X < —2)=0,3085 et 
P(X < 2) = 0,9332. Trouver le nombre réel a tel que P (e HN a) = 0,975. 


b) Soit U une va. de loi normale centrée et réduite et V une va. qui suit une loi 
du khi-deux à 16 degrés de liberté. Ces deux v.a. étant indépendantes, trouver le 


nombre réel b tel que P (F < +) = 0,975. 

A4 
D. On effectue deux tirages successifs sans remise dans une urne qui contient 3 
boules noires et 2 boules rouges. On note X la va. qui représente le nombre de 
boules rouges tirées et Ÿ la va. qui vaut 1 si on tire une boule noire au premier 
tirage et 0 sinon. Déterminer la loi de probabilité du couple (X, Y) puis calculer 
cov (X, Y). Les va. X et Y sont-elles indépendantes ? 


6. Soit X une va. de loi normale d'espérance 8 et de variance 8 (1 — 8), où 8 est 
un paramètre réel inconnu, avec 0 < 0 < 1. 


a) À partir d’un échantillon (X1,..., X1) de X déterminer deux estimateurs T} et 
T', de 8 par la méthode des moments, en utilisant les moments non centrés 
d'ordres 1 et 2. Étudier leurs propriétés. 


b) Comparer ces 2 estimateurs et indiquer celui qu’il faut choisir. L'un d’eux est- 
il efficace ? On donne V (2) = 207 (i — e?) : 


7. Soit X une va. de densité : 


a Ut) six <6 


où © est un paramètre réel inconnu. 
a) Calculer E (X). 


b) À partir d’un échantillon (X1,..., X1) de X déterminer un estimateur Ty de 8 
par la méthode des moments et étudier ses propriétés. 


c) Déterminer la loi limite de T quand ñ devient infini et en déduire un intervalle 
de confiance bilatéral symétrique de niveau voisin de 1 — x pour 6, dans le cas 
où on a observé un échantillon de taille supérieure à 100. On donne V (X) = 1. 


8. Soit (X1,.., Xn) un échantillon d’une va. X de densité : 


3x2 ; 
us < 
fG:0) = g si0<x<0 
0 sinon 


où © est un paramètre réel inconnu strictement positif. 


a) Déterminer la fonction de répartition de X, puis celle de 
My = Max {X1, Re 
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b) Représenter l'allure générale du graphe de la vraisemblance L(x1, ….,Xn; 0) 
pour (X1,.…,Xn) fixé et 8 variant. En déduire l’estimateur du maximum de vrai- 
semblance, puis un estimateur sans biais T, du paramètre 0. Est-il efficace ? 


c) Déterminer en fonction de «1 et æ les réels f1 et > compris entre 0 et 1 qui véri- 
fient les deux conditions : 


1 = P(My — 8 < —06f;) et œp = P(M, — 8 > —6f) 


En déduire un intervalle de confiance bilatéral symétrique de niveau 1 — & pour ©. 


Mai 2007 


1. Un magasin souhaite s’équiper d’un détecteur de faux billets de 500 euros. On 
note p la probabilité qu’un détecteur repère effectivement un billet qui est faux. 


a) On présente 100 faux billets à un détecteur bon marché et seulement 80 d’entre 
eux sont détectés. Construire un intervalle de confiance pour p, de niveau 
1— x = 0,95, à l’aide d’un abaque puis en utilisant une approximation que l’on 
justifiera, si l’on ne disposait pas de cet abaque. 


b) Ce caissier présente à nouveau 50 faux billets à un détecteur plus sophistiqué 
qui les a tous détectés. Construire à l’aide d’un abaque un intervalle de confiance 
de niveau 1—x=0,95 pour le paramètre p associé à ce détecteur. Quelle 
approximation pourrait-on utiliser ici si l’on ne disposait pas de cet abaque ? 


2. Soit X une va. de loi normale d'espérance 0 et de variance 20, où 0 est un 
paramètre réel inconnu strictement positif. 


a) Étudier les propriétés de l’estimateur X} construit à partir d’un échantillon 
(X1,., Xn) de X. 


b) Étudier les propriétés de l’estimateur sans biais T;, de 8 construit à partir de la 
variance empirique modifiée : 


Le _—— 
= —— > (XX) 
1=1 


c) Comparer les estimateurs T} et X, et indiquer celui qu'il faut choisir. L'un 
d'eux est-il efficace ? 


3. Une étude statistique effectuée pour la chaîne de magasins Farrecour a établi 
que le bénéfice mensuel moyen du magasin i,1 <i<n, pouvait être représenté 


par une va. de loi normale d’espérance 7; et de variance o?, ces valeurs étant 
déterminées par l'étude. Une campagne publicitaire nationale a conduit à une 
augmentation @ du bénéfice. Pour estimer ce paramètre réel inconnu 0, on 
observe sur une certaine période les nouveaux bénéfices mensuels moyens de 


chaque magasin i,1 <i< n, représentés cette fois par une va. X; de loi normale 


d'espérance "1; + 8 et de variance 02. 
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a) Déterminer un estimateur T; de 8 par la méthode du maximum de vraisem- 
blance. Étudier ses propriétés. Est-il efficace ? 


b) Déterminer un intervalle de confiance bilatéral symétrique de niveau 1 — x 
pour 6. Application : 6? = 1, aa” (x; — m;) = 270 et 1 — œ = 0,95. 


Janvier 2007 


1. Dans une certaine population, la probabilité de naissance d’un garçon est de 
4/7. Déterminer la proportion de familles de trois enfants où les enfants ne sont 
pas tous du même sexe, en précisant l’ensemble fondamental Q retenu pour 
modéliser ce problème. 


2. Soit p la proportion de bovins d’un département français atteints de la mala- 
die ESB (« vache folle »). On utilise un test de dépistage qui se révèle positif avec 
une probabilité 1 — & si l’animal est effectivement malade et avec une probabilité 
B si l'animal est sain. 


a) Déterminer la probabilité x (p) qu’un animal pris au hasard dans ce départe- 
ment soit effectivement malade, sachant que le test s’est révélé positif. 


b) On suppose à partir de maintenant que & = f. Déterminer x (p) puis calculer 
r(x). Commenter le résultat. 


c) Calculer la valeur de x (0,005) pour x = 0,02, puis pour à = 0,01. Commenter 
le résultat. 


3. La fonction de répartition d’une va. X est nulle pour x < 3 et pour tous les 
entiers ñ > 3 a pour valeur : 


1 
FH=I1-S sin<x<n+l 


Déterminer la loi de probabilité de X. 


4. Soit X une va. de densité : 
leve 
= + — —1<x<1 
or — 1° si x 
0 sinon 
a) Déterminer la densité de la va. Y = X2. 


b) Calculer E (Y). 
D, Soit X une va. de loi normale centrée et réduite. 


a) Déterminer la loi de probabilité des va. Y =2X,X+Y,X+Y+7 avec 
Z = —3X. 


b) Calculer cov(X, Y) et V(X+Y +2). 
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Septembre 2006 


T. On lance un dé rouge et un dé vert et on considère les événements À « obte- 
nir un chiffre pair sur le dé rouge », B « obtenir un chiffre pair sur le dé vert » et 
C « la somme des chiffres obtenus est paire ». Les événements 4À,B et C sont-ils 
indépendants deux à deux ? dans leur ensemble ? On précisera l’ensemble fon- 
damental Q retenu pour modéliser ce problème. 


2. On effectue l'expérience suivante sur la mémoire des rats. Un rat peut appuyer 
sur l’une des trois manettes placées devant lui et dans un seul cas il recevra de la 
nourriture. On note X la variable aléatoire qui représente le nombre de tentatives 
effectuées par le rat jusqu’à ce qu'il obtienne de la nourriture. 


a) Déterminer la loi de probabilité de X dans les 3 situations suivantes : 

— il choisit au hasard une manette à chaque tentative (aucune mémoire) ; 

— il exclut la « mauvaise » manette choisie à la tentative précédente (mémoire 
courte) ; 

— il exclut toutes les « mauvaises » manettes choisies aux tentatives précédentes 
(mémoire parfaite). 


b) Calculer dans chacune de ces situations la probabilité qu’il fasse plus de 3 ten- 
tatives pour obtenir de la nourriture. 


3. Soit X une va. de densité : 


X SLO EX EN 
POESIE 2 
0 sinon 


a) Déterminer la fonction de répartition de X et en déduire la médiane de cette loi. 
b) Calculer P {|X — 1| < x} pour tout réel x. 

4. Soit (X, Y) un couple de va. de densité : 

2 si0<x<y<l 


TE 


a) Déterminer les densités marginales de X et Y. Les va. X et Y sont-elles indé- 
pendantes ? 


O0 sinon 


b) Déterminer les densités conditionnelles de X sachant que Ÿ = y et de Ÿ sachant 
que X = x. 


5. Pour connaître la proportion p d'utilisateurs d'internet dans une région fran- 


çaise, on effectue un sondage auprès de N personnes qui ont été tirées au hasard 
et avec remise dans un fichier des habitants de cette région qui est découpée en 
deux zones rurale et urbaine. On tire donc deux sous-échantillons indépendants 


de tailles respectives n et m, avec n +m = N. On note Ts et T, les estimateurs 
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associés de p. On retient comme estimateur construit sur l'échantillon total 
PN = 4Tn + DT. Déterminer le réel b en fonction du réel 4 pour que cet estima- 
teur soit sans biais. Déterminer ensuite 4 pour que cet estimateur soit optimal. 


6. Soit (X1,.., Xn) un échantillon d’une va. X de densité : 

— Si0O<Xx<0 

FCO)= RE 
O0 sinon 


où © est un paramètre réel inconnu strictement positif. 
a) Calculer E (X) et V (X). 


b) Déterminer un estimateur T} de 8 par la méthode des moments. Étudier ses 
propriétés. Est-il efficace ? 
c) Déterminer un nouvel estimateur sans biais T}, de 8 construit à partir de 


My = max {X1,…, Xn}. Comparer les estimateurs T; et T}, et indiquer celui qu'il 
faut choisir. 


7. Soit (X1,.…, Xn) un échantillon d’une va. X de loi normale centrée et de 
variance 6, où © est un paramètre réel strictement positif. 


a) Déterminer un estimateur T; de 8 par la méthode des moments. Étudier ses 
propriétés. Est-il efficace ? 

b) Déterminer un intervalle de confiance de niveau 1—æx=0,95 pour 8. 
Application : De de = 100. 


Mai 2006 


1. Soit p la probabilité qu'une pièce produite par une machine présente un 
défaut grave. 
a) On prélève au hasard 150 pièces produites pour effectuer un contrôle de qua- 


lité. Sachant que 6 d’entre elles présentent un défaut grave, construire un inter- 
valle de confiance pour p de niveau 0,95. 


b) Une nouvelle machine est installée et sur 30 pièces prélevées au hasard aucune 
ne présente un défaut grave. Donner un intervalle de confiance de niveau 0,95 
pour ce nouveau paramètre p. Peut-on considérer que cette nouvelle machine est 
de meilleure qualité ? 


2. Soit (X1,.., Xn) un échantillon d’une va. X de densité : 


e-G-Ë) sir>0 


f (Gr; 0) = 


0 six < 6 


où © est un paramètre réel inconnu. 
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a) Déterminer l’estimateur 0; du maximum de vraisemblance du paramètre ©. 


b) Calculer la quantité d’information de Fisher 1; (8). L'estimateur 6, est-il effi- 
cace ? 


3. Pour connaître le budget mensuel consacré aux loisirs, on a effectué un son- 
dage dans neuf villes françaises auprès de 100 ménages. On note X la variable 
aléatoire qui représente le budget loisir d’un ménage tiré au sort et YŸ celle qui 
représente la moyenne d’un échantillon de taille 100 de ces budgets dans une ville 
donnée. On dispose donc d’un échantillon (Y1,..., Yo) de cette va. Y. 

a) Indiquer la loi qu’il est logique de retenir pour cette va. YŸ et en déduire alors 
la loi de la moyenne empirique YŸ9 de l'échantillon. 


b) Déterminer un estimateur de chacun des paramètres m = E(X) et 6? = V(X). 


c) Déterminer un intervalle de confiance bilatéral symétrique de niveau 1 — x 
= 
pour m. Application : + yi = 2709, se (yi — Yo) = 1800 et 1 — x = 0,95. 


Janvier 2006 


À. Parmi les patients venus consulter un ophtalmologue, 10 % étaient myopes, 


20 % presbytes, les autres ayant une bonne vue, les proportions de ceux déclarant 
souffrir de maux de tête étant respectivement de 90 %, 50 % et 5 %. Quelle est la 
probabilité qu’un patient souffrant de maux de tête n'ait pas besoin de porter de 
lunettes ? 


2. Soit X une va. de densité : 
SLOLSXS 1 
f Go = STE 


(G—x) si2<x<3 


NI NI NI R 


0 sinon 
a) Déterminer la fonction de répartition de X. 
b) Calculer E (X). 
3. Soit X une va. de loi normale, telle que P(X<3)=0,1587 et 
P(X > 12) = 0,0228. Calculer P(X > 0) puis trouver le nombre réel 4 tel que 
P(IX-EGOP <a) = 0,975. 


4. On lance 2 boules qui tombent chacune au hasard dans l’un des 2 tiroirs A ou 


B. On note X la va. qui représente le nombre de boules tombées dans le tiroir A 
et Ÿ la va. qui représente le nombre de tiroirs non vides. Déterminer la loi de pro- 
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babilité du couple (X, Y) puis calculer cov (X, Y). Les va. X et Y sont-elles indé- 
pendantes ? 


Septembre 2005 


T. Une urne contient trois boules rouges et deux boules noires. On effectue des 
tirages successifs sans remise et on arrête dès qu’on a obtenu 2 boules rouges. 
Préciser l'ensemble fondamental Q retenu pour modéliser ce problème et calcu- 
ler la probabilité de chaque événement élémentaire. 


2. Soit (X1,.…., Xn) des va. indépendantes et de même loi que X de densité : 
2(1—-x) si0<x<l 
f @) = 


0 sinon 


Déterminer la densité de la va. M, = max {X3,.…., Xn}. 


3. Soit X une va. de loi normale, telle que P(X<—1)=0,500 et 
P(—1,6 < X < —0,4) = 0,770. Calculer P (X > 0) puis trouver le nombre réel 4 tel 


que P (e +2X< a) = 0,995. 
4. Soit (X, Y) un couple de va. de densité : 


er Ayervetl<y<l!l 


(sa = À 


Déterminer les densités marginales de X et Y. Les va. X et YŸ sont-elles indépen- 
dantes ? 


0 sinon 


5. Un joueur participe à une loterie où sa probabilité de gain est 1/0, avec 0 > 1. 


Il joue jusqu'à ce qu'il ait gagné et on note X la va. qui représente le nombre de 
tirages indépendants auxquels il a participé. 


a) Déterminer la loi de probabilité de X et calculer E (X). 


b) À partir d’un échantillon (X1,.., X1) de X déterminer un estimateur T, de 8 
par la méthode des moments et étudier ses propriétés. 


6. Soit (X1,.…., Xn) un échantillon d’une va. de loi normale d’espérance 8 et de 
variance 20, où © est un paramètre réel strictement positif. On pose : 


Xx—0 
Sn 


2 1 nl d nl _ 
Xn= =D Xi; = (XX) Ty-1 = Vn 
i=1 i=1 


Déterminer à partir de T; _1 un intervalle de confiance bilatéral symétrique de 
niveau 1 — & = 0,95 pour © dans le cas où n = 30. 
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7. Soit (X1, , Xn) un échantillon d’une va. X de densité : 


0 sinon 


où 6 est un paramètre réel inconnu strictement positif. Déterminer un estimateur 
Th de @ par la méthode du maximum de vraisemblance. Étudier ses propriétés. 
Est-il efficace ? 


Mai 2005 


1. Soit p la probabilité qu’un système d’alarme se déclenche à bon escient. 
a) Sur 250 essais indépendants effectués dans une bijouterie il y a eu 240 déclen- 
chements justifiés de l’alarme. Construire un intervalle de confiance pour p de 


niveau 0,95 à l’aide d’un abaque, puis en utilisant une approximation que l’on jus- 
tifiera, si l’on ne disposait pas de cet abaque. 


b) Un nouvel équipement est installé dans cette bijouterie et sur 30 essais indé- 
pendants effectués, tous ont provoqué un déclenchement justifié. Donner un 
intervalle de confiance pour ce nouveau paramètre p de niveau 0,95. Peut-on 
considérer que ce nouvel équipement est de meilleure qualité ? 


2. Pour comparer deux modèles de pèse-lettre, notés A et B, on effectue des 


pesées successives indépendantes d’une lettre de poids exact connu 100 g. On 
note X la va. qui représente le poids affiché par un pèse-lettre. 


a) Indiquer la loi qu’il est logique de retenir pour cette va. X et préciser alors le 
paramètre Ô qui peut servir d’indicateur de qualité d’un modèle de pèse-lettre. 
Déterminer un estimateur T; de 8 construit à partir d’un échantillon (X1,..., Xn) 
de X et étudier ses propriétés. 

b) Pour le modèle A on a effectué 30 pesées indépendantes, les valeurs observées 
X1,-,X30 conduisant à  . x; = 3020 et ni e = 315400. Déterminer un 
intervalle de confiance de niveau 1 — & = 0,95 pour 8. 


©) Pour le modèle B on a effectué 50 pesées indépendantes, les valeurs observées 


Y…ys0 conduisant à D, y; = 4950 et D; y? = 510000. Déterminer un 


intervalle de confiance de niveau 1 — &« = 0,95 pour le paramètre 8 associé à ce 
modèle. Quel modèle vous paraît de meilleure qualité ? 


3. Soit (X1,.…., Xn) un échantillon d’une va. X de densité : 


1 
bb = — Di HOSXx< TI] 
0 sinon 


où © est un paramètre réel inconnu strictement positif. 
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a) Déterminer la densité de la va. ŸY = —In X. 
b) Calculer E (X) et V (X). 


c) Déterminer un estimateur T} de 8 par la méthode du maximum de vraisem- 
blance. Étudier ses propriétés. Est-il efficace ? 


Janvier 2005 


1. Le jeu de l'ambassadeur consiste à transmettre oralement à son voisin, sans 
que les autres entendent, un message compliqué pour s'amuser des déformations 
qu'il peut subir. Le message initial contient une quantité d’information notée 16 
(par exemple le nombre de phonèmes) et à chaque relais il y a une probabilité p 
qu'il soit transmis correctement. Avec une probabilité qg = 1 — p la quantité d’in- 
formation est diminuée et devient 410, avec 0 < a < T. On note I; la v.a. qui repré- 
sente la quantité d’information obtenue après n relais. Déterminer la loi de pro- 
babilité de 11, l puis l, pour ñ > 2. 


2. Une information est transmise sous forme de codage logique en 0 ou 1. 
Il y a une probabilité p d'erreur au cours de chaque relais de transmission, c’est- 
à-dire de transformer le 0 (resp. 1) en 1 (resp. 0). On note V, l'événement « l’in- 
formation transmise après ñ relais est exacte, c’est-à-dire identique à l’informa- 
tion d’origine » et on pose Pr = P(V»). 


a) Calculer p1 et po. 


b) Calculer p, en fonction de p;,_1 pour ñn > 2. 


l 
c) Calculer Un = Pn — 5 en fonction de u,,_1 et en déduire la valeur de uy, puis 


celle de pr, en fonction de ñ et p. 


Calculer la limite de p; quand ñn devient infini. 


3. Soit X une va. de densité : 
1 
fo=42 


a) Calculer E (X) et V (X). 


b) Déterminer la fonction de répartition de X puis calculer la probabilité que X 
appartienne à l'intervalle [x1,x2], en fonction des réels x et x2 tels que x1 < x2. 
4. Soit (X, Y) un couple de v.a. discrètes dont la loi de probabilité est donnée par 


le tableau ci-après. 


Calculer E (X), E (Y) puis cov (X, Y). Les va. X et Ÿ sont-elles indépendantes ? 
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X 
, =i 0 1 
À 1/8 1/8 1/8 
2 1/4 1/8 1/4 


@ ÉLÉMENTS DE CORRECTION 


Septembre 2007 


PAUB)= 3 PAUE) = à 


Bi 


À > Les hypothèses se traduisent par P (A NB) = 


On en déduit : 


P(ANB)=P(AUB)-P(ANB) —P(ANB) = 


P(A)= P(ANE)+P(ANE) = à 
P(B)=P(ANB)+P(ANB) =; 


Comme P (AN B)  P (A) P (B), les événements À et B sont dépendants. 


27 a Un joueur gagne s’il tire une carte paire et si le(s) précédent(s) a (ont) tiré 
une carte impaire. On obtient ainsi : 


3 0 Sn 
D 
3 RE 
Det 3 
b) On en déduit : 
3 6 3 D 35 
E(N) EX TSX op 50 


3 > OnaP(X <0) = P(X <1) = 0 et, pour n > 2: 


n—1 


PKEm=N PX=D=- G-;)+6 ;)+ 


k=1 
1 1 1 1 
+ — + — — 
5 —) = ;) 
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On obtient : 


EDR PS 203 1 = OO 


n+1. 
n=1 n=1 
c'est-à-dire que cette loi n’admet pas d'espérance. 


4 > 3) On pose m = E(X) et 0? = V(X) et on considère la variable centrée et 
réduite ; les conditions s’écrivent : 


P( < + 0601 P( <2) = 0,9332 
[eo] [eo] [eo] [eo] 


.2+m 3 . 
La table 1 permet d'obtenir = v et RE d'où m = —1 et o = 2. La va. 


2 
X + 
( ) suit une loi du khi-deux à 1 degré de liberté ; la condition : 


2 
X+1 è a+l 
21 ] ) < 1 À -097 


permet d'obtenir, à partir de la table 5, a = 19,08. 


b) La va. U 1 (VV/1) suit une loi de Student à 16 degrés de liberté, donc la table 
6 permet d'obtenir b = 0,53. 


5 > La loi du couple (X, Y) figure dans le tableau ci-après, avec les lois de X et 
Ÿ dans les marges de ce tableau : 


1 ? 
y 0 

0 0 - L e 
10 10 10 
8) 3 6 
L 10 10 5 10 
3 eo L 

10 10 10 


PROS 
Avec par exemple P(X = 1,Y = 0) = P(RN) = MATE On calcule à partir 


4 
du tableau E (X) = 5 EM = = etEUXY}=P(X=1LY="1) _ 
9 
Ainsi cov (X, Y) = ——— et les variables X et Ÿ sont dépendantes. 


50 
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6: a) Comme E (X) = 8, l’estimateur 1} obtenu par la méthode des moments 
est la moyenne empirique X3, estimateur sans biais et convergent d’après la loi 
des grands nombres. De même, E (2) =V(X)+E2(X)=6, donc 


1 _ 
Tes = .e est aussi un estimateur sans biais et convergent de © d’après la 
n 


loi des grands nombres. 


b) Pour comparer ces deux estimateurs sans biais, nous formons le rapport des 
variances : 


AGE 
V (Th) 
Comme cette quantité dépend de la valeur du paramètre à estimer, on ne peut pas 


conclure. Ces deux estimateurs ne sont pas comparables. Aucun d’eux ne peut 
être efficace, car il serait alors toujours le meilleur. 


= 20(0 +1) 


7 » à) On calcule E(X) = 8 +1. 

b) L’estimateur Ty = Xy — 1 obtenu par la méthode des moments est sans biais et 
convergent d’après la loi des grands nombres. 

c) D'après le théorème central-limite : 


re an E(X) 


5œ DD 


donc on obtient : 


VA (Tr — SN C;D 
O1 


1 

7) . On construit 
donc un intervalle de confiance bilatéral symétrique, puisque cette loi est symé- 
trique. On peut trouver la valeur aprochée de la constante 1 telle que : 


1-x=P(-u<Vn(Tr-68)<u) 


L'estimateur T; suit asymptotiquement la loi normale N (e. 


L'intervalle de confiance est alors défini par : 


u u 
Th — — <0 <Ty + — 
n Vñ n Vn 


où u est approximé par le fractile d'ordre 1 — 5 de la loi normale standard 
N(0,1). 


8 > a)Lafr. F de X est nulle pour x < 0, a pour valeur 1 pour x > 8 et a pour 
expression, quand 0 < x < 6 : 
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On calcule la fr. de M, : 


Go = Pay <= [VO «2 [GG «2 F'60 


i=1 i=1 
On obtient la densité par dérivation : 
g 0 = G'G = nP" TG) f 0) 
Donc pour 0 < x < 0: 
3n—1 
x 
& (x) = 3h FU 


b) L'expression de la vraisemblance est : 


3\t# 
LO,:5 4750) (à) IL 
i=1 


si 0 < x; <6 pour 1 <i<n. La vraisemblance, considérée comme une fonction 
de 6, est nulle pour 0<6<max{x1,…,%xn} puis décroissante pour 
8 > max{x1,.….,Xn} (voir figure 9.1) : 


Figure 9.1 


Il y a un maximum au point de discontinuité de la vraisemblance et l’estimateur 


3n 
du maximum de vraisemblance est donc M;. Comme E (M) = Al l’esti- 
Fe 3n+1 ce 
mateur sans biais est Ty = on Mn: La question de l'efficacité ne se pose pas 


car l’ensemble des valeurs possibles pour X dépend de €. 
c) Des deux conditions : 

1 = GI8(1 — H)] = (1 — H)°" 

1-0 =G[8(—H)1= (1 — 1)" 
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on déduit : 
h=1—oû8 = 1 (1 02)" 
L'intervalle de confiance est défini par la condition : 
1—ax=P{-06# < My — 8 < —0t} 


S'il est bilatéral symétrique &1 = &2 = &«/2, d’où l'intervalle de confiance pour 
GE 


eopiie CHE 


Mai 2007 


1 > 3) L'intervalle de confiance unilatéral obtenu avec l’abaque 1 est p > 72 %. 
On peut ici utiliser le théorème central limite : 


Vin EE = Nu 
p(1 — p) loi 


On utilise cette loi asymptotique pour trouver la valeur approchée de la constante 
u telle que : 


Pn (1 — Pn) <p 


=P|? 
0,95 Pn —U ra 


On a ici P100 = 0,8 et on lit dans la table 2 u = 1,645 d’où p > 73 %. 


b) On lit sur l’abaque p > 93 %. Pour cet échantillon, on obtient P50 = 1, donc on 


ne peut pas remplacer p (1 —p) par Pn (1 — Ph). L'intervalle de confiance serait 
obtenu par résolution de l'inégalité : 


2 Le 
fou) 20 D) 


2 > a) L'estimateur Xy est sans biais et convergent d’après la loi des grands 
nombres. 


1 
b) L'estimateur Ty = 5% obtenu par la méthode des moments est sans biais. La 


n—-1 
va. et suit une loi du khi-deux à #7—1 degrés de liberté, donc 


2 
VE) = En Cet estimateur est sans biais et sa variance tend vers zéro donc il 
ñ _—— 


est convergent. 
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c) Pour comparer ces deux estimateurs sans biais, nous formons le rapport des 
variances : 


V(T,) n 


VER) ont 


Comme cette quantité dépend de la valeur du paramètre à estimer, on ne peut pas 
conclure. Ces deux estimateurs ne sont pas comparables. Aucun d'eux ne peut 
être efficace, car il serait alors toujours le meilleur. 


3» a) L'expression de la vraisemblance est : 


(x; = c) 


n nl 
1 
Léo) = ][f&0) = 1 exp - 
cr ov?2T 20° 


i=1 
AL 1 2 
= (- =) exp 30 2 Gi m; — 0) 


La log-vraisemblance est donc : 


il nl 
In Lx,.…,Xn; 0) = —nin (ov2r) 302 S & M; F) 
i=1 
On obtient comme dérivée : 


Lol 
do = 22, tm) 
i=1 


1 
Elle s’annule pour 0 = = 51 (x; — m;). On dérive une nouvelle fois : 


d2InL. " <0 
00? = o2 


Le point qui annule la dérivée première correspond donc à un maximum et l’es- 
timateur du maximum de vraisemblance est : 


1 11) 
Ty = n 2 — m;) 
= 


Les va. Y; = X; — m; suivent des lois normales d'espérance 8 et de variance 0?, 
1 1 1 


donc Ty = YA est un estimateur sans biais et convergent d’après la loi des grands 
nombres. On calcule alors la quantité d’information de Fisher : 


92InL n 


L’estimateur est donc efficace puisque : 


6? 1 
PTS 0 
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b) L'estimateur Ty = YA suit une loi normale d'espérance 8 et de variance 67/1. 
On construit donc un intervalle de confiance bilatéral symétrique puisque cette 
loi est symétrique. On doit trouver la valeur de la constante telle que : 


moe P(u< VHS <u) 


L'intervalle de confiance est alors défini par : 


U u 
oœ <Tn—-0<0o 
ñn 


vn va 


Ce qui est équivalent à : 


u u 
Tn-0— <0<Ty+0— 


Vn Vnñn 
où u est le fractile d'ordre 1 — 5 de la loi normale standard N (0, 1). 


Application : 7,17 < 6 < 7,83. 


Janvier 2007 


1 > L'ensemble fondamental est constitué de tous les événements élémentaires 
possibles, écrits sous la forme de triplets dont la première lettre désigne le sexe du 
premier né. On a donc: 


O={E,G} 
Il y a équiprobabilité donc : 


3 3 
P(GGG) = 6) P(EFF)= 6) 


La probabilité que les enfants ne soient pas tous du même sexe est donc : 


OC 


2> a) Avec des notations évidentes : 


PMAT)e P(MP(T*|M) 
PU P(MP(T+|M)+P(M)P(T+|M) 


nrl=o 
PE pa 2 
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On obtient 7 (x) = 1/2, c'est-à-dire que dans le cas où le risque d’erreur du test 
est égal à la proportion d'animaux malades, il y a seulement une chance sur deux 
qu'un animal dont le test est positif soit réellement malade. 


c) On a: 
1—- ax 
1+198x 


Soit x (0,005) = 49/248(= 1/5) pour à = 0,02 et x (0,005) = 99/298(& 1/3) pour 
o = 0,01. Même avec un risque d’erreur de 1 % le taux de détection exact est de 
l'ordre de 30 %, c’est-à-dire très faible. Cela est dû au fait que la maladie est rare. 


x (0,005) = 


3 > La fonction de répartition est constante par morceaux, donc la loi de proba- 
bilité est discrète, avec ici X (Q) = {3,4,...,n,.….} et pour tous les entiers n > 3 : 


Pn=PX=n)=PX<n+1)—-P(X<n) 


1 1 1 
= F(n+1) —F(n) = (: x) (i xs) = Te 
4- a) On calcule la fr. de Y : 
G(y=P(Y<y) =P(R <y) 


On a donc G (y) = 0 pour y < 0,G (y) = 1 pour y > 1 et, pour 0 <y <1: 
G(Y)=P(-Vy<X< Vÿ) = F(Vÿ) -F(-vÿ) 


La densité est obtenue par dérivation : 


6 = 5 D + (VI = 75 (+30) 


b) On obtient comme espérance : 


I 7 
EG = 3 [ (V9 +87 Vÿ) dy = 


D > a) Toute fonction linéaire d’une va. normale suit une loi normale, donc Ÿ 
suit une loi normale centrée de variance 4, X + Y = 3X suit une loi normale cen- 
trée de variance 9 et X + Y — 3X = 0 suit une loi normale dégénérée (de variance 
nulle), c’est-à-dire est une variable certaine, P(X+Y +Z =0)=1. 


b) On a cov(X, Y) = E(XY) = E (2x) 2) =2aV(XrIYI2)=0 arcet 


une variable certaine. 
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Septembre 2006 


1 > L'ensemble fondamental est constitué de tous les événements élémentaires 
possibles, écrits sous la forme de couples dont la première lettre désigne le résul- 
tat du dé rouge : 


O={P,I} 


Les événements considérés sont A={(PP), (PI)}, B={(PP), (P)} et 
C = {(PP), (D}.Il y a équiprobabilité donc : 


2 
PA) =P(B}= PO = 


D'autre part, ANB=ANC=BNC= {(PP)} donc: 


P(ANB)= ; =P(A)P(B) P(ANC)= ; =P(A)P(C) 


P(BNO) = : = P(B)P(C) 


donc les événements À, B et C sont indépendants deux à deux. Enfin, 
ANBNC = {(PP)} donc: 


P(ANBNO = à # PUA)PE)P(O = à 


donc les événements À, B et C ne sont pas mutuellement indépendants. 


2> a) Avec des notations évidentes, on obtient dans le cas aucune mémoire 
(am) : 


n—1 
PÜX = =PINANN)= (5) A 


Dans le cas mémoire courte (mo) : 
1 — NN 
PX=1=:, P(X= n)=P(N.NN) = > 5 RE? 


Dans le cas mémoire parfaite (mp) : 


il Dal RS | 1 
PX= DE SPX=2)— = MPIX—=3)— = 
RE 
P(X=n)=0 n>4 
b) On calcule ensuite aisément, dans le cas am : 


er de _8 
30 57 57 or 


P(X < 3) 
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Dans le cas mc: 


P(X<3)-= 


L,11- : 
ss ue 0 
Dans le cas mp : 


1 
PX<S3)= + + =:(| Pmp = 0 


1 
3 
3 > a) La fonction de répartition de X est nulle pour x < 0. Son expression pour 
O<x<1 est: 


x 
F@= | tdt = 7 


Pour 1 £X< 2: 


x 
FG=FOD+ | Q—bdt=- +2x—1 
1 


1 
On a ensuite F (x) = 1 pour x > 2. Puisque F (1) = 5’ la médiane vaut 1 (c’est le 


centre de symétrie de cette loi). 
b)OnaP{|X—1|<x} = 0 pour tout réel x < 0. Pour x > 0: 
P{X-1|<x}=P{1-x<X<1+x}=F(1+x) —-F(1-x 
Donc P {|X —1| < x} = 1 pour tout réel x > 1. Pour 0 < x < 1 : 
P{IX-1|<x}=1-(1- x) =x(2-x 


4 > à) Les densités marginales de X et Ÿ s’obtiennent par intégration de la den- 
sité du couple (voir figure 9.2) : 


+00 1 
#@= | f@ydy=2/ dy=2(1-x) si0<x<1 
—CO A 


+oo y 
# = f fydx=2 | dx 2 S0<y<i 
0 


— C0, 


On constate que f (x,y) fx (x)fy (y) donc les va. X et Y ne sont pas indépen- 
dantes. 


b) Les densités conditionnelles s’obtiennent en divisant la densité du couple par 
la densité marginale de la va. qui conditionne : 


Que 
fr(y) y 


Il s’agit de la loi uniforme sur l'intervalle [O, y] : 


fx (xIY =y) 


pour0O<x<Yy 


La loi de Ÿ sachant que X = x a pour densité : 
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0 y x I 


Figure 9.2 


X;U fl 
fé ex) LED 2 pour x <y<1 


Il s’agit de la loi uniforme sur l'intervalle [x, 1]. 


5 > Les estimateurs Ty et T}, sont sans biais, donc E (fn) =4E (Ta) +bE(T/) 
= (a + b) p. L’estimateur PN sera aussi sans biais si b = 1 — 4. Les estimateurs Ty 
et T}, sont indépendants, donc : 


a 2 2 1 a2 ( =. a)? 
V (Pn) = 4° V (Ta) + DV (Ty) =p(1-p) lee 
L’estimateur optimal est celui de variance minimale ; on doit donc minimiser la 
fonction de 4 : 


2 2 
a (1 — a) 
Den 
C'est une fonction de dérivée : 
2a 2(1—a4) 
! SP ne Ne CN, 
QE n m 


n DUN 2 . 
La dérivée s’annule pour 4 = avec f” (a) = — + — > 0 donc l’estimateur 
n+m nm 
sans biais optimal est : 


2. (lave 
PN = N 
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6 > a) Nous calculons l'espérance de cette loi : 


ape 26 
E (X) = — x dx = — 
62 Jo 3 


Pour calculer la variance, nous avons besoin de : 
ANT e? 
E () = — dx = — 
82 Jo 2 


PÉOSE (2) _ E2(X)- : 


D'où : 


b) En égalant E (X) avec la moyenne empirique X,, on obtient comme solution 


— 
Q;= 5 Xn. L’estimateur obtenu par la méthode des moments est donc : 


CE o 
Cet estimateur est sans biais, E (Ty) = 5E (Xh) L 5E (X) = 8, et convergent, car 
d’après la loi des grands nombres : 


X4 F E(X) 


3 
d’où on déduit en multipliant par 5: 


per = re 
+2 


2 


On peut également établir la convergence de cet estimateur sans biais en mon- 
trant que sa variance tend vers 0 : 


At 
ver = V (5X) = 5 (R) = 0 


L'ensemble des valeurs possibles pour la variable est ici X (Q) = [0,0] qui dépend 
du paramètre à estimer. L’inégalité FDCR n’est donc pas vérifiée et la question de 
l'efficacité ne se pose pas. 


c) La fr. F de X est nulle pour x < 0, a pour valeur 1 pour x > 8 et a pour expres- 
sion, quand 0 < x < 0 : 

D: : 

OS dt = © 

0° Jo ] 


On calcule ensuite la f.r. de M, : 
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G(x) = P(Mn < X) -r {A ) Je or eo 


i=1 i=1 
On obtient la densité de M, par dérivation de sa fr. : 


2n—1 
g) = G' (x) = nFT (x) f (x) = nn 


/ 
R 
/\ 
[a] 


Ainsi : 


( 
2n 2n 
E(My) = <- M x = 
(M) PEUR 2n +1 


La valeur de E (M3) montre que l’estimateur sans biais est : 
Tr =— 


Pour les mêmes raisons que dans la question précédente, la question de l’effica- 
cité ne se pose pas. On calcule ensuite : 


() 
2n 2n 
de 2n+1 4e 2 
E (Mi) =: 1 Er Dot 


D'où la variance : 
n 2 
(n + 1) Qn + 1)? 


V (Mn) = E (MÈ) — E? (Mn) = 


La variance de cet estimateur est : 


2 2 
vir=y A Or D Me (e) 
2n 


An2 An (n + 1) 
Nous allons comparer ces deux estimateurs sans biais en formant le rapport de 
leurs variances : 


PONS 


V(Tr) n+1 


L'estimateur T}, est donc infiniment plus efficace que Ty. 


7 > a) On a E(X2) = 6, donc l’estimateur T, de @ par la méthode des moments 
est la moyenne empirique : 


Cet estimateur est sans biais : 


ELLE (2) = 0 
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Il est aussi convergent d’après la loi des grands nombres : 
X2— E(X2)= 0 
P 


Pour savoir s’il est efficace, on détermine d’abord l'expression de la vraisem- 
blance : 


n 


nl 2 
1 ke 
LG, %n;0) = [[fGx:0) = [T TP - 26 


i=1 i=1 


in. 1 > 
= (=) D 35 2% 


La log-vraisemblance est donc : 


n n 1 
In L(ti,..,%n; 0) = = In (27) — 5 In0 — 56 2% 
1= 


Soit en dérivant : 


dInL CON 
08 20 20 22% 
On dérive une nouvelle fois : 
ner 1 
un 
00 26 9° 
On calcule alors la quantité d’information de Fisher : 
9 InL n Le n 
(8) =E - L E(X) = © 
; | 20? ) 282 © > RTE 


La va. X2 /9 suit une loi du khi-deux à 1 degré de liberté, donc V(X2) = 20? et : 


20? 1 
Or Rae) 


L’estimateur T; est donc efficace. 


b) La va. nTh/8 suit une loi du khi-deux à n degrés de liberté. Le paramètre 8 
mesurant un degré d’imprécision, on choisit un intervalle unilatéral défini par : 


ia p {Pr a) 
100 


Application : T59 = 2 et a = 34,76 d'où l'intervalle 8 < - 2,88. 
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Mai 2006 


1 > 3) L'intervalle de confiance est unilatéral à gauche en raison de l’interpréta- 


tion du paramètre. La taille d’échantillon (1 = 150) permet d'utiliser le théorème 
central limite : 


Va EN 0 
p (1 a p) loi 


On utilise cette loi asymptotique pour trouver la valeur approchée de la constante 
u telle que : 


mA -F 
0,95=P |p<pPn+u Pn (= Pn) 
On a ici P150 = 4 % et on lit dans la table 1 u = 1,645 d’où p < 7 %. 


b) On doit utiliser l’abaque car ñ = 30 est trop petit ; on lit p < 8 %. L'estimation 
de p est ici de 0 % contre 4 % dans le cas précédent. Cependant, cela conduit mal- 
gré tout à un intervalle de confiance plus grand car la taille d’échantillon est très 
petite. On ne peut pas conclure à une meilleure qualité de la nouvelle machine. 


2-2 L'expression de la vraisemblance est : 


nl n nl 
LC. Xn) 0) = I[/ (x;; 0) = exp — S (x; — 0) = e"Pexp (- D) 
i=1 


i=1 i=1 
si O<x; pour 1<i<n. Cette fonction de 6 est croissante pour 
0 < min {x1,..,Xn} puis nulle pour 8 > min {x1,.….,xn} (voir figure 9.3) : 


LÀ 


0 min x; 0 


Figure 9.3 


Il ÿ a un maximum au point de discontinuité de la vraisemblance et l’estimateur 


du maximum de vraisemblance est donc 8, = min {X:,.., Xh}. 
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b) La question de l'efficacité ne se pose pas car l’ensemble des valeurs possibles 
pour X dépend de 8. On peut cependant calculer la quantité d’information de 
Fisher : 


0InL 


00 


2 
In (6) = E (-) = À 
3 > à) La va. Y étant la moyenne de 100 variables indépendantes d'espérance m 
et d'écart type ©, on peut considérer qu’elle suit la loi asymptotique déduite du 
théorème central limite, c’est-à-dire qu'elle suit une loi normale d'espérance m et 
d'écart type © /10. La moyenne empirique Yo suit donc une loi normale d’espé- 
rance m et d'écart type divisé par V9, soit o /30. 


b) La moyenne empirique Y9 est un estimateur sans biais de m. La question de la 
convergence ne se pose pas puisque la taille d’échantillon est ici fixée à 9 ; cepen- 
dant il s’agit quand même d’un bon estimateur car cela correspond à 900 obser- 
vations individuelles. La variance empirique modifiée : 


est un estimateur sans biais de la variance de Ÿ qui vaut 02/100. 


c) Pour construire un intervalle de confiance bilatéral pour "”, on utilise la statis- 
tique : 


Ja 
So 


qui suit une loi de Student à 8 degrés de liberté. On peut donc trouver la valeur { 
telle que : 


1m ue P(-t< VE «t) 
9 


L'intervalle de confiance est alors : 
Y Fe <m< Yo+ ls 
9 3 9 9 3 9 
Pour 1 — & = 0,95 le fractile est { = 2,306 et on obtient l'intervalle : 


289,5 < m < 312,5 
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Janvier 2006 


1 > Avec des notations évidentes, les hypothèses se traduisent par : 


jl 2 # 
P (MY) = 10 P (PR) = 10 P (BV) = 10 


9 5 1 
PMTIMY) = PMTIPR)= 5 POMTIBV)= 


On en déduit : 


| 

_ PGBVOMT 10 * 20 AP 

ROEMDE om DR AT D 
102 10 C10 10 19 2 


2 > a) La fonction de répartition de X est nulle pour x < 0. Son expression pour 
O<x<Tlest: 


x 2 
F&= | re 
0 


Pour LÉx<2: 


il 2x —1 
F(=F(D+ f jit = 2 
Pour 2<5%<3": 
Toi m2 “ 
FO =F@+ | 3 be X° + 6x — 5 
D 102 4 


On a ensuite F (x) = 1 pour x > 3. 


b) On obtient : 


_ à 


x + - 


E(X) = a + 


3 » On pose m = E(X) et 0? = V(X) et on considère la variable centrée et 


réduite ; les conditions s’écrivent : 


P(S <") == 0848 P( - 2e) = 0,9772 
© © [eo] © 


2 — 12 — 
La table 1 permet d'obtenir — = —let = ML 2 d'oum=6eto=3.Onen 


déduit : 


PX>D=P(ES > -2) -P(S< <2) = 0,9772 
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2 
X—-6 
La va. (=) suit une loi du khi-deux à 1 degré de liberté ; la condition : 


2 
X—6 a 
21) < :) = 0,975 


permet d'obtenir, à partir de la table 5, a = 45,18. 


4 > La loi du couple (X, Y) est donnée dans le tableau suivant, avec les lois de X 
et Ÿ dans les marges : 


y - 0 il 2 
1 1/4 0 1/4 1/2 
2 0 1/2 0 1/2 
1/4 172 1/4 il 


2 
1 
Avec par exemple P(X=1,Y=2)=2%x ( ;) . On calcule à partir du tableau 
3 
ÉCOY=LlL EN. ; étECXY)— 5 Aüinsi cov (X, Ÿ) = 0 et les variables X et Y sont 


cependant dépendantes, car par exemple P(X=1,Y =1)ZP(X=1)P(Y=1). 


Septembre 2005 


À > La construction d’un arbre permet d'obtenir aisément 
Q = {RR, RNR, RNNR, NNRR, NRNR, NRR}, avec: 


3 1 1 

P(RR) = 10 P(RNR) = 5 P(RNNR) = 10 

1 1 1 

P(NNRR) = 10 P(NRNR) = 10 P(NRR) = 5 


On peut vérifier que la somme de ces probabilités est bien égale à 1. 


2” lafr F de X est nulle pour x < 0, a pour valeur 1 pour x > 1 et a pour 
expression, quand 0 < x < 1 : 


x 2] 
F6 =2 | (i—#dt=2 mel aue 
0 2 - 


On calcule ensuite la f.r. de M, : 


G(x) = P(Mn < x) -r {A < ») = JIPS<9= 760 
i=1 


i=1 
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On obtient la densité de M; par dérivation de sa fr : 
1 2 n-1 
gx) = GG) =nF"T (Of (= 2n (1x (2x -x2) O<x<1 


3 > La moyenne 7 = E(X) étant le centre de symètrie de la loi normale, on 


en déduit m = —1. On pose 0? = V(X) et on considère la variable centrée et 
réduite ; l’autre condition s'écrit : 


LI GER 2) =20 () 1 = 0,770 
© © © © 


La table 1 permet d'obtenir 6 = 1/2. On en déduit : 
P(X>0)=P(2X +2 > 72)=0,0228 


La va. 4(X + 1)? suit une loi du khi-deux à 1 degré de liberté ; la condition : 
P {4x2 + 8X +4 < 47 +4} = 0,995 
permet d'obtenir, à partir de la table 5, a = 0,97. 


4 > Les densités marginales de X et Ÿ s’obtiennent par intégration de la densité 
du couple (voir figure 9.4) : 


+oo œ 
#@= | fente | e*dy=1-e* si0<x<1 
—00 0 
1 
#@= | e"dy=(e-1je * sil<x 
0 


+00 +00 
#@ = f fps | en dm=l i0<y<i 


= y 


On constate que f (x,y) # fx (x) fy (y) donc les va. X et Ÿ ne sont pas indépen- 
dantes. 


Figure 9.4 
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5 » a) La va. X suit une loi géométrique de paramètre 1/0 : 
k—1 
1 1 
P(X=k) == [1 - ke N° 
Œ=-b=gfi-s) ke 
avec E(X) = 8. 


b) En égalant E(X) avec la moyenne empirique X,, on obtient comme solution 
0 = Xy. L’estimateur obtenu par la méthode des moments est donc Ty = Xy. Cet 
estimateur est sans biais, E (Ty) = E (X») = E(X) = 8, et convergent d’après la loi 
des grands nombres. 


6 > Pour construire un intervalle de confiance bilatéral pour 0, on utilise la sta- 
tistique T;,_1 qui suit une loi de Student à n — 1 degrés de liberté. On peut donc 
trouver la valeur f telle que : 


X, = 0 
1-a=P(-t< VS <1) 
Sn 
où t est le fractile d'ordre 1 — _ L'intervalle de confiance est alors : 


== S —_ S 
Hot te 
Pour 1 — à = 0,95 et n = 30 le fractile est { = 2,045. 


7> L'expression de la vraisemblance est : 


n 1 1 n n Vo 
L G, y Xn 6) = I[ AL = G) | ) 
i=1 


i=1 


La log-vraisemblance est : 


à 


InL(x,.….,Xn; 0) = —-nln0 — G + 1) In x; 


= 


er 


On obtient comme dérivée : 


dInL Ole 
Re = + ge 2m 


1 
Elle s’annule pour 0 = à 5 In x;. La dérivée seconde est : 


A CO 
Mn ÿ_nx; 
28 eg + 


Au point qui annule la dérivée première, la dérivée seconde est négative, donc 
cela correspond à un maximum et l’estimateur du maximum de vraisemblance 
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est : 
1 n 
Fr : 
ne > In X; 
i=1 
Nous avons E (Ty) = E (In X), donc nous calculons : 
1 +00 : = 
E (In X) = / % Le Tin xdx 
0 Ji 
Soit en intégrant par parties : 


+00 +00 
E (In X) = ER x| + | < lool = 6 
1 1 


Cet estimateur est donc sans biais et convergent d’après la loi des grands 
nombres : 


1e F0 =:0 


Pour savoir s’il est efficace on calcule alors la quantité d’information de Fisher : 
d7InL Hard n 
In (8) =E sr Ent) = 
: | 00? ) 2 65 > " @ 


Il faut maintenant calculer : 


1 +00 | 
E (in xÿ = : | » Pl (In x)? dx 
il 


Soit en intégrant par parties : 


+00 +00 
E (In x) = En (in | + 2 | on xdx = 26E (In X) = 26? 


1 
Ainsi V (In X) = 6? et : 


Vinx) 68? 1 


V (Th) = _ = TL (6) 


donc l’estimateur est efficace. 


Mai 2005 
1 > 3) L'intervalle de confiance unilatéral obtenu avec l’abaque 1 est p > 93 %. 


On peut ici utiliser le théorème central limite : 


VRP SN) 
p (1 se p) loi 
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On utilise cette loi asymptotique pour trouver la valeur approchée de la constante 
u telle que : 


À En (1-$ 
0,95 =P [fu re 


Onaici P250 = 0,96 et on lit dans la table 1 u = 1,645 d’où p > 94 %, résultat très 
proche du résultat exact précédent. 

b) On doit utiliser l’abaque car ñ = 30 est trop petit ; on lit sur l’abaque 1 p > 90 % 
avec pour cet échantillon P30 = 1. Bien que l'estimation soit plus élevée que dans 
le cas précédent, cela conduit malgré tout à un intervalle de confiance plus grand 


car la taille d’échantillon est très petite. On ne peut pas conclure à une meilleure 
qualité du nouvel équipement. 


2 > 2) On considère que le poids affiché peut s’écrire X = 100 + €, où on fera 
l'hypothèse que l'erreur de mesure € suit une loi normale centrée. La variance 
notée © de cette loi sera un bon indicateur de qualité ; moins les mesures affichées 
seront dispersées autour de la vraie valeur, meilleur sera le pèse-lettre. On retient 
comme estimateur sans biais de cette variance théorique la variance empirique : 


1 nl 
Ti= > (X; — 100) 
= 


La va. 11/8 suit une loi du khi-deux à n degrés de liberté, donc E (Th) = 8 et 
V (Ty) = 20° /n. 


b) Le paramètre mesurant un degré d’imprécision, on choisit un intervalle unila- 


téral défini par : 
fl 
l=x=P? 
x { 5 a) 


Pour ñ = 30 on lit a = 18,49 et on obtient comme estimation : 


dl 
Te = 35 (815400 — 200 x 3020) + 1002 = 380 
d’où l'intervalle 6 < 617. 
©) Pour n = 50 on lit a = 34,76 et on obtient comme estimation : 
1 
Le = 5 (510000 — 200 x 4950) + 1002 = 400 


d’où l'intervalle 0 < 575. Bien que l'estimation soit ici plus grande, l'intervalle de 
confiance est plus petit car la taille d’échantillon est plus grande. Le modèle B 
paraît donc de meilleure qualité. 


3 > a) La fr. de la va. Y = —In X est nulle pour y < 0 et a pour expression pour 
Y>0; 
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G(y)=P(-mX<y)=P(nX>-y =P(X>e ?) 
=1-F(e"?) 


où F est la fr. de la va. X. On en déduit par dérivation la densité de Y, qui est 
nulle pour y < 0 et qui a pour expression pour y > 0: 


8 (y) =e Ÿf (e+) " se "9 


On reconnaît la densité de la loi exponentielle de paramètre 1/0. 


b) Nous calculons l'espérance : 


ANT de 1 
E@=S | 2 = 
6 Jo 


6+1 


Pour calculer la variance, nous avons besoin de : 


1 
1 1 

E(x) = f et = 1 
6 Jo 268 +1 


D'où : 


e2 
VOOSE (2) — E2(X) = ; 
(8 +1)" (28 +1) 


©) L'expression de la vraisemblance est : 


2 NZ 1/81 
ÉCieE Xn: 6) = I[ = il — G) (II ) 


i=1 


La log-vraisemblance est : 
1 
InL(x,.….,Xn; 0) = —n in + = 1 > ne 


On obtient comme dérivée : 


oInL n LE 
36 ” Le 


Elle s’annule pour 8 = —— ne 1 nx;. La dérivée seconde est : 


2 
= à DE In x; 


Au point qui annule la dérivée première, la dérivée seconde est négative, donc 
cela correspond à un maximum et l’estimateur du maximum de vraisemblance 
est : 
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12 
Th = —- ) In X; 
n = 2 n A; 


Nous avons E (Ty) = E(—In X) = E(Y) = 8 donc cet estimateur est sans biais ; ila 
pour variance : 


V(-mx) 6? 
nl nl 


V (Tr) = 


1 
Il est donc convergent car cette variance tend vers 0 avec —. Pour savoir s’il est 


efficace, on calcule la quantité d’information de Fisher : 


d?InL Ha 0 n 
In (8) =E : + E(-In X;) = — 
: | Te ) eg 0 2 "ue 


Ainsi : 
8 1 
ro 


donc l’estimateur est efficace. 


Janvier 2005 
1 > Ona: 
PH=l)=p PH =alb)=1-p 
PH=l)=P PH=alÿ=2pl1-p) P(R=10)=(1-p) 


Plus généralement, pour tout entier K tel que 0 <K < n: 
he k 
P(u=n) = (pr <(-r) 


2” a) On obtient p; = 1—-pet: 
po = P(V2V1) + P (V2Va) = (1 —p)° +p? 
b) Pour n > 2 : 
Pn = P(VaVy_1) + P(VrVn_1) 
= P(Vy 1) P(ValVu1) + P (Vu 1) P(Va[Vr 1) 
= Pi (1—p)+(1—p4 1) p=p+(1—2p) pr 1 
c) On obtient : 


1 _ 1 
Un = Pa 5 = (1—2p}u 1 = (1-2) un =. (1—2p)" 


Ainsi, pour 0 <p <1: 
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il L 
Pn= + 2p)" > jcar | 2p| <1 


avec Pn = 1 sip = 0 et px = 1, Pay = 0 sip=1. 


3 » a) On obtient E (X) = 0 car la loi est symétrique et : 
2 fl fl 
. 2\ _Z 2 4 2 
VQo=E (x) =2 ] (x +3xt) dx 5 


b) La fr. Fde X est nulle pour x < —1 a pour valeur 1 pour x > 1 et a pour expres- 
sion, quand —1 <x <1: 


Nes Cl 
F(x) = 2 |dt= 
ds LG?) Ho 


La probabilité demandée se calcule par : 


p=P{Xe[m,x1} = | f dt = F (2) — F (1) 


On a p =0 pour x2 < —-1 et 1 < x1, les autres valeurs étant indiquées dans le 
tableau suivant, en fonction de la position de x et x : 


mel << lei IE ei Ml = << 
1 
à ( +x — 2) 


d 
4» On obtient E(X)=0 car la loi est symétrique, E(Y) = 5’ 


il 1 il 

3 3 3 
— + X) + 2) 1 (x X1) + (x 56 ) 
4 (5 22 4 à 1 4 V2 D 


cov (X, Y) = E (XY) = 0. Les variables X et Ÿ sont cependant dépendantes, car 


1 3-13 
par exemple P (X LY 2) 37P&X -DPY=-2D=2XxS. 


Tables statistiques 


Table 1 : Fonction de répartition de la loi normale centrée réduite 
Table 2: Fractiles de la loi normale centrée réduite 

Table 3: Loi binômiale 

Table 4: Loi de Poisson 

Table 5: Fractiles de la loi x? 

Table 6 : Fractiles de la loi de Student T,, 

Table 7 : Fractiles d'ordre 0,95 de la loi de Fisher-Snedecor 


Table 7 (suite) : Fractiles d'ordre 0,975 de la loi de Fisher-Snedecor 


Abaque 1: Intervalles de confiance pour une proportion (bilatéral de niveau 0,90 
ou unilatéral de niveau 0,95) 


Abaque 2 : Intervalles de confiance pour une proportion (bilatéral de niveau 0,95 
ou unilatéral de niveau 0,975) 


Ces tables sont publiées avec l’aimable autorisation de la Revue de statistique 
appliquée, numéro spécial Aide-mémoire pratique des techniques statistiques, éditions 
du CERESTA, 1986. 
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a,p82l 
985 
0,6893 
DUYTE 


RTE 
ESSE 
DPXS 
0.974 
DSgEl 


d,5041 
5418 
a.5432 
6217 
d6591 


LR EE 
qr291 
Gré11 
0, 7910 
sise 


QREAR 
1665 
CRETE) 
0,904 
LTÈOT 


GAME 
0,463 
Û, 4554 
û,5644 
9,9719 


9779 
doEé 
JouG4 
0,986 
{LD 


2 Si] 
9,995 
0,346 
14475 
ARC P 


Table 1 
Fonction de répartition de la loi normale centrée réduite 
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Probabilité F(u) d’une valeur inférieure à 4 


nl, 55 DT 
UK TE 
d.5E7I 
6245 
(LÉEIE 


LUXE AI 
LME] 
01642 
G,1916 
D#2lZ 


D#dGl 
868 
ASE 
OJüéé 
&u2+22 


09257 
D,9474 
D 473 
5636 
05726 


GE 
UE LE LA 
AL LT 
O,S#94 
(A 22 
DE L 
Û,595% 
0,557 
Ü,Eé 
0,692 


Tables pour les grandes valeurs de u 


û, 71 
A,F437 
d.5411] 
ILE 
Géést 


Hs 
Q3357 
01673 
CRE 
04134 


GRETA 
DATE 
RAT 
û,9082 
09234 


09370 
(USE 
CIC AT ES 
RAS 
0,9722 


LUE 
09834 
u,9871 
oh 
OUTRE 


0,394 
CERN 
LE] 
CEE 
QGGRI 


QUE 


Cd À 0,5671 


0,99951 | QOUHÉS 


TE 
0,1457 
D, SY4E 
L645) 
LE 


LMICRE | 
0,7359 
7704 
0,1955 
06264 


DESOE 
08729 
DK92$ 
0,199 
FRET 


0.362 
OMIS 
ELU 
0,967] 
0.9738 


49701 
DE 
U9875 
ETES 
HUIT 


LUS 
©9959 
(9969 
DOITT 
LAuEd 


0,188 
0,5196 
GT 
CRETE 
DÉTE 


U,TDen 
Qi 
C,7754 
C,8023 
G,82$9 


1,853] 
8749 
MESTE 
RTE 
1,1265 


0,394 
D,4$15 
9,5395 
(T4 
(4744 


QG TT 
[LEA 
US& 7H 
LR AT 
LR] 


LRU EC 
0,904 
1.397 
ARE 
LR LEE 


ÿ,$239 
ETES 
dé 
LC LL 
Û6T7Z 


Ü, 7123 
0, 7454 
Û,7TTÉA 
AUS 1 
D8315 


d4554 
HATTIU 
HEUEZ 
4914] 
1HYITY 


G,94ûé 
AYS1E 
960 
CET 
D47SÙ 


0,9603 
CET 
O.J8El 
0.990g 
DIRE 


OS 
DSi 
0,967 
0,9579 
MALE 


U,5279 
9,5675 
nf 
16443 
GRO 


LR 
DES 
Ê,7794 
QEUTE 
0,534 


08577 
GR TK 
RTE 
d,147 
(242 


a,5117 
q57lé 
LCA 
(É4 EE 


09306 


GHAIË | 38 
09525 | 19535 
69616 | 09625 
09692 | 0.9609 


0.9 356 


0,9408 
0.9850 
d,9E84 
n,9911 
ü.9932 


0,5949 
1,99€? 
2,997 
0,73 
UUURS 


Qédét 


Os 12 
LLC RE | 
09487 
9913 
1,9954 


CET EN 
ET) 
0,9973 
0,990 
PRET 


65355 
65753 
06141 
DGSLT 
RTE) 


07224 
07549 
ETES 
TEE 
DESR9 


08621 
DRTEU 
ETES 
UT 
5319 


944] 
US 
0.9633 
6.9706 
5,977 


9417 
LE N) 
G,3R90 
9916 
C4916 


09952 
64964 
09974 
D,9981 
QUE 


gouad1| 0,658 ET U555991 
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Table 2 
Fractiles d'ordre P de la loi normale centrée réduite 


Co ou ac on [or fa fs oc ss ous Jour 


5,0) AQU VASTE L'ATAIE |'LÉS21 12,875 ASIA 24972 | 3,4089 | 2, 16$6 | 24163 
Got 23263 É 2257] [2,162 | 210: Fat [ET 2.969 20748 | 10517 
QU AGENT [2 ol 45 LOL | 1,8854 [1.477 à 1,4431 | L9268 | LSILO TL LE9$7 | 8808 
DOG ELS608 L1,8662 D'I8522 | 1,824 | 1.425 £ 1,991 | L,2866 | 1,744 | 17624 | 1,737 
O0 1.350 119392 1 1,7279 817160 | 1, GA | 1,684 LIGA | 1 éGeé D G5aé | 1,6440 
OS | 16649 [16352 | 1,4258 | 4164 | 1,607 jé LABO | LARAS | LS DS | 15548 
DM | ISSAA | 1,544 | RATE LA 460 LS 15063 | LAUÉS | 1,4 À 14833 | 1.475€ 
SAT | LATA L 1,dé6t M6 À SE LT ddéé | 1. 1,4325 | L42SS | TAIET PLATE | 1 4ûél 
DO [14051 13984 13917 [13852112 T2 | LAGSS FLA49S | 7,3542 468 | 7,408 
009 CLOS L'Aé | LAS | 1,4228 14168 | 15 13647 PURE | 12000 | 2873 | 12416 
LG PI,28LS | 12759 | 'E2702 | 1,2646 À 1,2: 2946 | LARGE EG LATE D RRUIG |TAIÉS 
Doll V1.2245 |'IIUS | LEI6O | 12707 ARUES | 7.2Kd | 1,1652 | TRI F LI8S0 | LE&OO | 11750 
QUES 1 1.4380 | 1,1700 À 11680 | T.1ÉGE | IS : 1,1435 DLT4GT à 1,159 PRIT | 1,136 
LES 1,196 | 11219 À EUMTO [LAS 1 PLLS 10983 [10039 10894 LLuéas | |.0803 
d1+ |1.0803 | 10758 À 10714 | LOGE | LORS DGSE E1,0577 | 10444 | L0450 | LOT | 10164 
GAS [10164 | 10123 | 10279 | L,9247 |], BST 0116 LOGS L'LOG2 DOUÉ |, 00dS 
GS [099445 |CLOMM | GE LOI | GTS ; EST OSGGL LONGET DGSE | 0,474 
Qi [08542 | 09507 | 40463 109474 | O,GFRS : (9307 166269 109230 [09182 | 69154 
QUE [06154 [0,91 16 3 0,9078 | 9040 | GX | 0. 08027 | GS8G0 0885 | EESIÉ | 6719 
0,19 [08799 | 0442 DUSTUS EOSGES | 0. LÉ LEE LOT DORARE | M E431 | 08416 

à DIS |'OSSEL [OSAS É5710 | 0, A SEC LOSTES ETS TALONS | EDG 
021 GE | ORAN |A 500 | CFO | 0, 897 JOLTESE VOTE LOUTIUK] [NTTS6 | TT 
C2 O7 JUHGEE DOTGSS ETS | 0,7: A QE POTAËS [rasé DTA | OTIRE 
23 |40,7288 10,7356 | 7333 E 07280 | 0,72: k QT IUTIC TO 7128 | 07095 | W7067 
D 107063 | OT L6908 LCÉDÉ7 | OE : LGBT 1 06840 LOLGEOE | 04776 | 674 
OS [06745 | 'OÉTLS LO6GE2 FOGGST | OZ LÉSRE LOGS$7 | 06326 1 06495 À Dédéd EG 33 
O6 VOA DOS LE 6472 | OAI | O6: Ê2 00250 | 06214 [UGIS0 LOGS FOST2E 
QT OGLSS OGUE LOGOGE | ÉLADAE | Ni, is 0,5948 | 05918 | USÉES LOSASE | OLSETE 
0,38 [05826 [0,5799 | 6,5760 L O5740 | 0, Li 05681 | 05622 105592 | 0,556 | 0,554 
(20 [6,544 {0,505 |OS4TE E 0,546 | Q5417 | 0,53 0,5380 | 0,530 | 05202 | 0,5273 | 0,5244 


Uoua | COUT | 002 | GK L'EAGC 
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Table 2 (suite) 
Fractiles d'ordre P de la loi normale centrée réduite 


RL 


5215 loi 451 3129 | 0,310] £ SO | A4E7 
0,4930 | QG, GAËLT | 0, Q4761 [4 04705 
464 dé as | 04563 À DAS | O4 4482 : 0,427 
04572 0, k , 4267 ; O2 LU 04152 
24097 | 040 ATH 43884 | 0, CLR EL 0,388 


0424 lo T2 ON45 [034719 | 0. GA66S LOAGAE | OST 
03558 | 0353 MAUR EUECEES EURE ET 25 | 0338 10 G,4345 
13287 | 0, k DRRIES MARIE: 03134 LE, G308 L 
03029 | 4002 LUE JO E 07924 |O,3E QIRTL LORS 103819 
QTét | 0,2 TES PUCES FOET 41102411 | 0, 22553 


LME à 0,2430 | di 02353 1 0.2327 | 9230 
02250 | 0,2224 PÉRRURI EN EUYI CES LE Dé f 0,20 G,245 
(LS [DITES : 9.1919 | 9.1841 LG, 01840 Qu, LTTES 
A3 | D17L4 FO 1687 FO1662 | 0,163 61536 0,1535 
(ia | 03459 ÉO, 0,148 LT ÉRCRLPRERAS LE 1282 


4231 | 0.1296 0, 9,115$ 1130 01080 l'O, LH LE Tel 
D.0079 | 00954 LE ARC BAUER EU (0838 DOG | GTS 
A 028 | 0702 too r LOGKS2 FTC27 PO, LOTET LE 0,0527 
Abé LOST ÊG0426 FO | ORTA RAF RARE RTE DOTÉ 
00226 | OO PTS 0.010 | 0.0125 [00106 | 6,007 


SH | O9 | EE 


Grandes valeurs de u 


CETTE Le 


17 LC 
3,1993 5,6120 3.907 
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Table 3 
Loi binômiale 


Probabilités cumulées 


[En 
Probabililés cumulées Fr (K€ = Les p'il- pi 


=D 


da | D6648 | 09987 | O6 | LLés4i Ü, 4486 
09651 | Q9%LS | 04139 à DÉS | OEdET 07301 
0,8971 | 09958 | 9885 1 CSL | GAFIT 0,328 
69990 | age | ogooû | 04960 | DAgéd ILUHT2 
ë 1 0498 | 09998 | 09997 O4 
1 1 Il 0,19 
i 
0,817 04420 | 0,358$ À 02901 | 0,714 81216 
0.881 08102 | 07353 | Céi0S | 0,586 a,3317 
0,9561 | 09745 | G8860 | OETAN CLÉ TE 
0,9926 | 09841 À 09710 | 0953 OHô TD 
0460 | 09974 À Gdd | 09894 OISE 
Dés | 0997 | 9991 | 09981 QBET 
1 ] 269 | G9997 GATE 
1 1 C3gu6 
3998 
1 
d,5455 pagag | aotaé | Giséa | Ot134 | 00820 | Gusg1 | M4 
dR 104 6611 | 05535 | G4S55 | 05604 | 62054 | 02343 | 01877 
DATES nat | ORL22 | 07324 | Gédsé | G30%4 | D4RSS | G4114 
0,997] 0,6604 | 09392 | 06974 | 064sû | 63842 | NJL7S | (éd 
9,3596 ouais | QiRad | Goes | 09447 | 09126 | DH723 | CEA 
1 06369 | 09967 | 09921 | Duasé | 69707 | 9518 | G9268 
0,9168 | 0,964 | 09083 | 09960 | 09915 | G,484$ | 0074? 
Î 0,09%9 | 0,607 | 09992 | oosen |'oggss | 0.9922 
1 0,996 | 09999 À 9066 | 09910 | ose 
1 1 69000 | ougas | tu9us 
ë 3 CRU 
i 
0,1299 | 00769 | 00453 | Gozéé | 00155 | GO | LE 
04905 | 02794 | nE000 | 91265 | 00625 | uusaz | 003586 
0667 | 05405 | D4l6t | 3108 | 63360 | Glégs | CIE 
0,8409 | Gé | 6471 | 05427 À 04253 | u3303 | O75u 
08s10 | Gégég | uso | Gré00 | 62 | 6277 | OA? 
osëss | 04627 | ogara | Géosû ! 0,7016 | 090472 | Qéifil 
0,6264 | 09882 | 00711 | 09417 À 089%] | Us404 | GTI 


d.8002 és | OK À GITE À 09562 | 19234 | GET/3 
DOS | 04697 | G6073 | 09927 | MIS | (HT | Ait 
L 09698 | 0,043 L Q9U7S | 099441 | 09875 | Q97FS 


I 0,988 | OH | 09981 À 04957 | 380 

| 0,009 | GIOJE À (LONET | O996E 

l 06990 | DH | MU] 

1 CAHIA4 | ULSUUT 

[l D 99 
k 
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Table 4 
Loi de Poisson 


Li 
nm Hi 


Probabilités individuelles Pr(fi- à 


an=Ù, 


étés 
03031 
O.0TSE 
0126 
CARE 


Aer 


SE 
Et 


& d,1676 DATA] 1,1433 Os 2l TUAGE QUES Qû183 91111 RCLST 
1 M3679 DAT LUE 9,2633 Q,i494 QT 0,0733 0,150 00337 
à CALE D,2$ Tir IA LASLE 02440 0,1530 Ü.1463 QULZS ALLÉE MA 
7 
4 


Probabilités individuclles Prékis 


GK13 Q2TS 0.184 02134 2240 (2154 105 LALETI Ü. 14 
Q053 G,71 QE 01456 LA LI IR LIRÉRET LM IAOE U,1143 


) DAK131 RUES (LAVE LEER DUGGs ER EPSE ÿ,1322 Ê,1561 GUTOS 9,1755 
6 DURS RRETELT Co] 20 0.0278 G,0-5tM ü,09771 41042 CRETE 0,146? 
T OéiL Gi GUIE D RE El ER TEN L ALL E LOU RL 1, 1lkt 
ä LH G000s 0,163 4 GiHist Ê, Gi {0388 64 Ê Us 
9 


CELUI TRS QAITEZT CG LAND PA RUE FA DAME UE) 


id RTL GC AUTRE) LËD SA GC 0181 
11 GORE AL CHKF7 0014 AXE) Q.0082 
12 GOTKH OCR LLAUNINe] GUté OH 
LE DCE 002 0, CS ©9113 


14 LLANTCRER OI,DHKET HOÛGS 


IS D, CKII LAN Ier 
lé CCC 
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Table 5 
Fractiles d'ordre P de la loi x2 


El OGC GO O0 GE Dr 05 7 075 09 OS C3 09 GES 01 


1 | 0000 GC OO COM Got O1 CAS LOT 12 11 GAL 3507 6631 JÉS IUT 
à | GCOO O0 OS O1 011 057 186 2409 271 460% 3991 1738 910 1047 13415 
4 GO GS 026 032 OS I 1366 1665 dl 61 TES 935 [LAS L106 1626 
d | O7 O7 dd OTIL Loét UD 7357 AUS 559 og ASS 1114 277 130 16467 
5 | O2 0354 OA LAS Lélt 267 dl 606 663 924 ILOO 1163 H066 (6,56 26,515 
6 | dti Of72 LA Hfd 2204 745 OS TA T4 NÉS VAS 1445 ISLE 865 12,477 
1 | 00 14 6 ZT 2831 425 Gi 6383 SI 1207 147 16H 18475 203 A3 
ë Lt ét 218 274 3490 507 T4 O5 IN22 14362 ISSU 1752 20060 2203 26115 
GUN 280 27 AA AIS 500 Ki 10656 1149 IAE 15919 IS 21666 366 22877 


10 | 216 256 32 494 4665 ri HI LIEN Léa 1,087 18,307 1948 28 2545 74558 
26 506 FAI 457 5578 758 LOI LAS HAT 19,273 1JÉTS 2191 ÀTAS 26,82 1264 
IE | 3607 357 440 521 034 843 (HD LEO I4ES 1845 20006 JA A1 2,5 GT 
13 | 357 4H SO SA 782 930 A0 15.119 1598 SLI 229702 MATH ZTG8S 287 ASE 
OL AUTOS 565 657 790 1016 14439 16227 1742 10 15,664 26,12 2941 41,37 36,123 
5 | 460 Si 626 726 MT II 1H NTUI 1625 22,397 24606 27,49 ST ANS 37.07 
16 | SE SET  GUI  7Sé 6912 IN ES LEA 031 2345 269196 45 32000 31 39331 
ITU ETS  GAT Ti RGT IGORS 1278 DÉAM 18511 A0 44768 27587 4119 5416 457% do 
IH [46 TAN Kaas 036 IOfes 1367 IF Jiléil 216] 254049 26669 3155 MAS 4719 42314 
15 | Gé 763  ESL HO 1161 1446 16,336 21689 2272 TM 30,14 F5 36191 3662 43,820 


A7 | OFAT KG GB ARS JEAA3 1545 1934 22575 2344 ZRAIE 31410 SIT 376 4003 45315 
il 802 800 1028 IISG 14340 164 O3 25658 AG OS SLGTE 648 36952 41,43 49.797 
27 | St 054 LOS 154 II 174 33 939 160 SIA FAO HITS AUS 4183 AK 
23 | 02% ID LI60 1309 Idfd# IR92 2253537 MAIS 2714 2206 35172 3444 41.658 441[ AU 
4 | O9 (DS LED ISÉS 15639 LOS 25,347 2709 2424 13196 .36414 536 42980 45,44 31.119 
ë5 |1B54 1152 SIA IG SAT LES A ARTE AM CAE T2 41 4414 4680 528 
26 1120 A2) HNIS84 13538 1729 20440 25,4 UId6 20430 1535 38483 dl A5 412 Sin 
JT HS 288 ST 1615 él 2175 26,356 36319 3145 36741 49113 4319 46563 43,67 35,476 
28 FL 15e 1531 GES HN 266 2736 31381 62 17916 4137 4146 ABS SLUZ Sé5 
29 PLATS 1426 6 UT NT 266 28236 3246 MAT] 49067 42,397 dit 4385 14 SAT 


AD [USE LAS 16979 RAS 2089 JA 29356 33530 480 40258 44772 4698 SUYZ 5370 ST) 
A OZ 2216 Zéd1 MSI 2906 és 4 HIS ASE SLR SST6 SM 636 Enr 74,4 
SD [MO OU Hé M6 1 494 415 STI 56 6117 65 9147 7615 150 666 
F0 [3555 JAN AXES 4AIS didé 299 50% GUN 6 TAG 1008 SAM HER Oidé 63 
SU [42 444 4876 5174 3535 Ool70 6051 7540 7238 8394 0003 0302 lŒdè E04.22 112,4 
BD [SAS Si EI OO GA TES US Bél2 SEI3 UaSé JULSE 10667 11233 1671 LEÉS 
Où [SIL 6175 6565 6914 7320 ÆVEI 03 651 966 10786 TELUS TB 12412 1831 1572 
IN [ét GONG HAE 799 82e GI 9992 601 10014 1IÉS0 1244 12956 IHAI MIE 14444 
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Table 6 
Fractiles d'ordre P de la loi de Student T, 


0,60 4,70 ME Œ3Ù 0,95 Mo7i | Co | ogg 
L 425 1,376 À 3,076 | äna | vin | ais | çsée | sas | éséé 
2 u,289 Lil 1856 | 2620 | 403 | ô5es | os | os | 3160 
ï U377 Gos À Las | 2353 | 182 | 441 | sa 10,22 | 1244 
4 a27l Oyal 1523 | 2132 | 2776 | Aa | 46m | 7113 | sélo 
5 1,267 0920 | 1476 | 201$ | %s7] | 3365 | 4m | ses | éaso 
ä 264 noos | sta | 1943 | 2447 Foauas Fam | son | saso 
7 TETE oésé | Lis | Laos | 2265 | 2008 | 34 | 43us | s40s 
# 0,263 osss | 1397 | 1,660 | 2366 | 2406 | 33355 | 43 | si 
ÿ ü.261 mssa À 1483 | 1833 | 262 | ail | Ag | 42397 | 474 
1ù UE égis À Lara | O1uiz | 2228 | 2364 | uno | 414 | ais 
11 ü,264 oaé À agi | 1796 | 23 2718 | Gi | 4025 | 4437 
12 0,254 mers | agé Dogs | 3129 | 2681 1055 | 2930 | 4318 
13 0,247 agro | ass À Onast | gage | ago | ai | 2852 | 41 
14 0,258 ofeg | En45 | Liél | 2145 | 064 | oz | sir | 414 
15 U.254 Dié | Ed) 163 | 215 | 2,609 9047 | 3733 | 4073 
lé 0,358 nus À nait | Lidé | 2120 | 2,583 | 2621 | 2686 | 401 
17 {ST uses | os | pag | min | Gars D oueos | agé | 3665 
1# 0,257 oBe | ao | on | am osse | ous | 261 | 392 
13 0257 DSL as | Lan | 2ogi À 5,530 | Zant | 29379 | ga 
o0Ù 257 oseo | 1,925 | 1725 | Song | 28 | naas | 562 | =#sû 
91 4,357 859 | nas | dou | “om | use | augsr | 3527 | 3&18 
33 1,256 04H55 | 1,321 1717 | 2074 | 2508 | 20 | its | à 
7 4,756 0858 | 1315 | ri | 2e | 3400 | enr | 348s | 3,987 
ad 2,256 og | Ag | Li | 2ags | 207 | 2487 | 4746 
25 4356 ü856 | 1,318 | cro | 2060 | as | over | vase | 3,725 
é L356 osé | us oiros E soûr À oo | ao | ais | ax 
TT 0,256 oass | 1414 | croi Ê 2052 | 2473 | 2711 £ 34u | 3490 
28 0,256 0855 | 1,313 | tro) Ê 2048 | 2467 | 2763 À 2408 | 3,674 
24 RRET ous+ | 1,911 | Léon À 2046 | Garr | avé | daué | 4659 
aü 0256 oes4 | 1,310 | ‘éur | or | 2457 | aan | agi | 4636 
32 ñ,26 0553 | 1200 | io | 2041 | aug Loos Vas | 2632 
Et 255 nRs2 | 930 ogg | ous F oodar | ous | aan | 31e 
#5 Ü,255 nése | Oianc | 1688 | 2028 | 3434 | mio PL On | 454 
3 1,258 QFSL sant | rérs | os | 'Oang | 2712 | 3218 | 354 
ait 255 FH ET saut | Léës | ana: | 42 | 27 À ac | al 
sû 4,255 Gsag | 6208 | 1676 | 200 | sans | sers E 2261 | 3436 
at 1,754 507 | Gas | 2e | ner | om E sauce | goût | 3212 | 2460 
70 0.254 oetr | 194 | Léër | noué | Saut L'eau | 3313 | 3435 
#0 Ü.254 Geig | 1,202 | :éés | Loco | 2374 | 2ége | ais | 24is 
gû Q.5<4 uses | 1,191 62 | 1987 | we L'or | sis | 44 
x 0.254 AE 290 | 660 | Los | 2365 | 2ué | 3174 À 250 
i 2 (254 TE 286 | 1,653 | 1972 4 2245 | 2401 A141 | 3336 
, SX U,253 d.447 23 | 1 | Loës | 2334 | 0568 | 3106 F an 
Lo QAER looga2 | 1282 | oeas | 1960 | 2e | gs | sugo À agul 
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Fractiles d'ordre 0,95 de la loi de Fisher-Snedecor F(v1, w) 


Dh rs — 


-3 


Table 7 
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7 4 | 
T6 as 24 [sas [isa 
132 154 | 124 | 194 | 194 
PR an | dust 47| gt 
6,59 ss] Auf ses soi 
sal ant au] 474] 46 
3.76 all 41$} 4%] 4m 
415 sl ul 3m] 357 
4 LA al 445 Aif 
3,86 2 as) 344) au 
471 auf dur} 234| 29: 
a au av 265] 27 
447 251| 24] 21%] 346} 
44: am | 217[ 38) di 
153 am 2u| 2%] 293) 
139 zut Zi 254] 245 
dl 146) Sarl at 
ann] ZS$] 245] 224 
am aol 41) 1 
264] as] al 23: 
aur| das] Au] 1 
245 24 2.41 Lits 
246] 240] 232] 12 
al 1u) 227] 130 
ad il 146] ie 
24n| 14] 22] 2 
2al au) 23] as 
ul au) 226 216 
a) 229) 29] 21 
136] zx 218] 710 
1U| 18) al 
1351 al siml tu 
ALT dit Le EU 
aug) Jo 1] 144 
20! Lol 183) 675 
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Table 7 (suite) 
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Fractiles d'ordre 0,975 de la loi de Fisher-Snedecor F(M1, w) 


soc 
392 
lil 
1,6 
Ti 


à 
ge [os 
5943 | 593 
19 | 147 
Ji 926 
TS] ge 
sa | fu 
sa] 
im | 45 
44 | 437 
d.24 si! 
DOC RTE 
3 | 37 
an | 4% 
am] 35 
as] 341 
3% | 34 
34] 32 
am] 372 
an | 47 
3H 4 3/3 
a%| 3% 
ANT 3 
ill 15 
A5) 25 
341 23 
A 4 
AUX 153 
3] 139 
qu) 23 
Ju) 24 
29] 2174 
ÉRCE PES 
ZA 251 
381 341 
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